麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 學院 > 開發設計 > 正文

提取網頁特定數據的案例

2019-11-14 09:58:37
字體:
來源:轉載
供稿:網友

BeautifulSoup可以使我們通過網頁的標簽找到網頁中我們想要的特定數據。本案例可以清楚地理順從html文件變化到我們想要獲得的數據。Python程序如下:

from bs4 import BeautifulSoupimport requestsurl = 'http://new.cpc.com.tw/division/mb/oil-more4.aspx'html = requests.get(url).textbs = BeautifulSoup(html, 'html.parser')#PRint(bs)data = bs.find_all('span' ,{'id':'Showtd'} )#print(data)rows = data[0].find_all('tr')#print(rows)prices = list()i = 0for row in rows:    if i < 16:        print(row)    cols = row.find_all("td")    if len(cols[1].text ) > 0:        item = [cols[0].text, cols[1].text, cols[2].text, cols[3].text]        prices.append(item)    i += 1i = 0for p in prices:    if i < 16:        print(p)    i += 1現在從變量容器的變化過程,認識提取特定數據的步驟:

通過BeautifulSoup(html, 'html.parser'),把html文件包裝為可以解析的對象,該對象對應的文本文件(部分內容)是:2.操作可解析的對象sb,通過find_all('span',{'id':'Showtd'}),把標簽<span></span>的內容找出來,形成數據表:3.再從上面的數據表中,找出標簽<tr></tr>表示的項,組成如下表:4.對上表的每個表項<td></td>再進行提取,得到最終數據:


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 综合精品一区 | 亚洲欧美一区二区三区在线观看 | 国产一国产一级毛片视频 | 成人一级毛片 | 亚洲成人精品一区二区 | 双性帝王调教跪撅打屁股 | 久久第四色| 久久免费视频7 | 久草在线新时代视觉 | 成人福利视频导航 | 精品一区二区三区中文字幕 | 亚洲网在线观看 | 亚洲成人福利在线 | 欧美国产成人在线 | 国产午夜精品一区二区三区免费 | 男男羞羞视频网站国产 | 免费色片 | 2021av视频| 国产亚洲精品久久久久久久久久 | 成人在线观看免费观看 | 亚洲精品一区二区三区免 | 日韩精品hd| 成人午夜免费福利 | 久色视频网站 | 销魂美女一区二区 | 手机在线看片国产 | 七首小情歌泰剧在线播放 | 久草在线手机视频 | 日韩av在线播放一区 | 久久久久久久爱 | 激情综合婷婷久久 | 日本黄色免费片 | 国产无限资源在线观看 | 污片视频在线观看 | 成人三级黄色片 | 久久综合综合久久 | 一本到免费视频 | 国产精品久久久久久久久久久久久久久久 | 日本成人一区二区 | 一本色道久久99精品综合蜜臀 | 草草视频免费 |