麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 學院 > 開發設計 > 正文

網絡爬蟲：Requests+lxml

2019-11-14 12:00:31

字體：大中小

來源：轉載

供稿：網友

比較常用

# -*-coding:utf8-*-import requestsfrom lxml import etreeurl="http://econpy.pythonanywhere.com/ex/001.html"page=requests.get(url)html=page.textselector = etree.HTML(html)buyer=selector.xpath('//div[@title="buyer-name"]/text()')這個用的少一些

# -*-coding:utf8-*-import requestsfrom lxml import htmlurl="http://econpy.pythonanywhere.com/ex/001.html"page=requests.get(url)tree=html.fromstring(page.text)buyer=tree.xpath('//div[@title="buyer-name"]/text()')prices=tree.xpath('//span[@class="item-price"]/text()')print (buyer)print (prices)Xpath的語法參考 http://www.companysz.com.cn/xpath/xpath_syntax.asp Chrome中使用時可以下載插件：Xpath helper參考使用requests和lxml編寫python爬蟲小記 http://www.tuicool.com/articles/vABNRbR

XPath在python中的高級應用參見：http://blog.csdn.net/winterto1990/article/details/47903653

但是遇到中文網頁時，中文出現亂碼。

req = requests.get("http://news.sina.com.cn/")print (req.text)

為了解決這個問題，請參考這篇文章： http://blog.csdn.net/chaowanghn/article/details/54889835

上一篇：Leetcode 113. Path Sum II

下一篇：springmvc頁面提交中文亂碼問題

學習交流

索泰發布一款GTX 1070 Mini迷你版本:小機

索泰發布一款GTX 1070 Mini迷你版本:小機箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

榮耀總裁趙明烏鎮演講：榮耀首款5G手機V30下月發布

2019-10-23 09:17:05

搜狐張朝陽：回歸媒體是搜狐重新崛起的關鍵

2019-10-21 09:20:02

華為輪值董事長郭平：虛擬技術創造現實價值

2019-10-21 09:00:12

滴滴英文服務上線兩周年用戶已超200萬

2019-09-26 08:57:12

華為推出全球至快AI訓練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國技術團隊

2019-09-25 08:15:43

疑難解答

圖片精選

網友關注

主站蜘蛛池模板：一级毛片大片 | 欧美亚洲一级 | 欧美 videos粗暴 | 黄色片免费在线播放 | 看个毛片 | 免费看欧美黑人毛片 | av人人| 国产在线精品91 | 香蕉成人在线观看 | 国产成人精品午夜 | 亚洲五码在线观看视频 | a免费毛片| 久色成人网 | 91精品国产91久久久 | 国产精品免费在线 | 亚洲成人福利网站 | 国产午夜精品视频免费不卡69堂 | 免费啪视频在线观看 | 男男羞羞视频网站国产 | 91精品国产91久久久 | 鲁久久| 偷偷草网站 | 久久精精品 | 国产欧美精品一区二区三区四区 | 女人久久久www免费人成看片 | 久久久精品视频网站 | 美国人成人在线视频 | 主播粉嫩国产在线精品 | 成年人福利视频 | 性生活香蕉视频 | 成人在线视频黄色 | 精品一区二区中文字幕 | 7777欧美 | 成人18免费观看 | 中文字幕精品在线视频 | 国产草草视频 | 精品国产乱码久久久久久久久 | 国产91一区二区三区 | 麻豆国产网站 | 国产成人高潮免费观看精品 | 日本看片一区二区三区高清 |