麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Python > 正文

淺談Python中的bs4基礎

2020-02-15 23:19:24
字體:
來源:轉載
供稿:網友

安裝

在命令提示符框中直接輸入pip install beautifulsoup4

介紹

beautifulsoup是python的一個第三方庫,和xpath一樣,都是用來解析html數據的。

引入

from bs4 import BeautifulSoup

使用

將一段文檔傳入BeautifulSoup的構造方法,就能得到一個文檔的對象。

bs = BeautifulSoup(open('index.html',encoding='utf-8'),'lxml')print(bs)

注意:這樣上傳文檔的話,BeautifulSoup里面需要兩個參數。一個為open方法,一個是固定寫法,也就是解析器。

open方法里面也同樣需要兩個參數,一個是想要解析的數據,另一個為設置編碼的格式。

(1)獲取網頁中的title標簽

print(bs.title)

(2)獲取head標簽及標簽內部的所有其他標簽

print(bs.head)

(3)獲取當中的第一個a標簽

print(bs.a)

注意:獲取文檔當中所有的xx當中第一個xx或者第一個xx里面的內容。都可以用bs.xx來獲取

(4)獲取指定標簽的所有屬性

print(bs.a.attrs)

(5)獲取標簽的屬性

print(bs.a['href'])

(6)獲取標簽的文本內容。

print(bs.a.string)

注意:string獲取的文本指的是本標簽的文本,不包含子標簽的文本

(7)contents能夠獲取指定標簽下面的所有內容。

print(bs.body.contents)

(8)獲取所有內容當中指定索引的內容

print(bs.div.contents[3])

(9)通過id和類名來找標簽

print(bs.find(id='kw'))
print(bs.find(class_='shopping'))

注意:id是唯一的,通過id來找,只能找到一個,所以用find,而class不是唯一的,通過class來找,就有可能找到多個。

(10)select選擇指定的標簽

print(bs.select('title'))
print(bs.select('a'))

在bs4中,小數點“.”表示類名,#表示id

print(bs.select('.first'))
print(bs.select('#kw'))
print(bs.select('div.now'))

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對武林站長站的支持。如果你想了解更多相關內容請查看下面相關鏈接

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 性爱视频在线免费 | a免费视频| 国产精品欧美久久久久一区二区 | japanese嫩21videos| 日韩欧美激情视频 | 久久精精 | 久久精品一区二区三区四区五区 | 视屏一区 | 免费看真人a一级毛片 | 免费观看高清视频网站 | 182tv成人福利视频免费看 | 国产精品久久久久影院老司 | 天天看天天摸天天操 | 在线观看免费毛片视频 | 亚洲国产一区二区三区 | 久久99综合久久爱伊人 | 欧美成年人在线视频 | 爱逼爱操综合网 | 国产羞羞视频在线免费观看 | 久久久成人免费视频 | 在线播放视频一区二区 | 久久国产成人午夜av浪潮 | hdbbwsexvideo | 精品中文字幕视频 | 中文字幕极速在线观看 | 暖暖免费观看高清完整版电影 | 九九热在线视频观看这里只有精品 | 久久国产精品系列 | 国产精品一区二区羞羞答答 | 亚洲最新色 | 久久久一区二区三区精品 | 成人mm视频在线观看 | 天天操综 | 精品国产呦系列在线看 | 色就操| 色吧久久| 97超级碰碰人国产在线观看 | 一级毛片播放 | a一级黄色大片 | 国产69精品福利视频 | 亚洲男人一区 |