麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 學(xué)院 > 開發(fā)設(shè)計 > 正文

提取網(wǎng)頁特定數(shù)據(jù)的案例

2019-11-14 09:19:32
字體:
供稿:網(wǎng)友

BeautifulSoup可以使我們通過網(wǎng)頁的標(biāo)簽找到網(wǎng)頁中我們想要的特定數(shù)據(jù)。本案例可以清楚地理順從html文件變化到我們想要獲得的數(shù)據(jù)。Python程序如下:

from bs4 import BeautifulSoupimport requestsurl = 'http://new.cpc.com.tw/division/mb/oil-more4.aspx'html = requests.get(url).textbs = BeautifulSoup(html, 'html.parser')#PRint(bs)data = bs.find_all('span' ,{'id':'Showtd'} )#print(data)rows = data[0].find_all('tr')#print(rows)prices = list()i = 0for row in rows:    if i < 16:        print(row)    cols = row.find_all("td")    if len(cols[1].text ) > 0:        item = [cols[0].text, cols[1].text, cols[2].text, cols[3].text]        prices.append(item)    i += 1i = 0for p in prices:    if i < 16:        print(p)    i += 1現(xiàn)在從變量容器的變化過程,認(rèn)識提取特定數(shù)據(jù)的步驟:

通過BeautifulSoup(html, 'html.parser'),把html文件包裝為可以解析的對象,該對象對應(yīng)的文本文件(部分內(nèi)容)是:2.操作可解析的對象sb,通過find_all('span',{'id':'Showtd'}),把標(biāo)簽<span></span>的內(nèi)容找出來,形成數(shù)據(jù)表:3.再從上面的數(shù)據(jù)表中,找出標(biāo)簽<tr></tr>表示的項,組成如下表:4.對上表的每個表項<td></td>再進(jìn)行提取,得到最終數(shù)據(jù):


發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 毛片118极品美女写真 | 中文字幕在线观看日韩 | 极品销魂一区二区三区 | 黄色片视频在线观看 | 国产午夜精品久久久 | 欧美xxxx精品另类 | 国产精品亚洲精品久久 | 免费淫视频| 亚洲国产在 | 国产精品成人免费一区久久羞羞 | 一区二区三区无码高清视频 | 91麻豆精品国产91久久久更新资源速度超快 | 免费一级毛片电影 | 性高跟鞋xxxxhd4kvideos | 久久精品4 | 一级免费特黄视频 | 草妞视频 | 日韩一级毛毛片 | 亚洲免费观看视频 | 成人高清网站 | 久久久久久久一区二区 | 爽成人777777婷婷 | 亚洲精品成人久久 | 中文字幕在线观看视频一区 | 国产精品久久久久久久亚洲按摩 | 欧美性受xxxx人人本视频 | 精品国产乱码一区二区 | 国产成人在线网址 | 久色婷婷| 欧美人成在线 | 久久久久久久久免费 | 久久久久久久91 | 中国黄色一级生活片 | 手机免费看一级片 | 欧美在线观看视频一区 | av在线等| 亚州成人在线观看 | 91精品久久久久久久久久久 | 在火车上摸两乳爽的大叫 | 黄色的视频在线观看 | 国产二区三区在线播放 |