BeautifulSoup常用方法

2021-06-23 05:01:26 字數 431 閱讀 3182

1. 初始化

2. 查詢指定標籤

eg:要找到符合的所有標籤

p.findall('div',)

反覆利用標籤特徵可以找到最終需要的標籤

3. 直接加標籤名可以找到所有子標籤

eg:找到所有標籤

p.td()

4. 直接以字典形式,可以訪問標籤內對應屬性的值

eg:要找到

中href

的值'www.csdn.net'

p.['href']

4、要獲得標籤的內容,可以直接加.string

eg:要找到

中的'1235'

p.string

參考

Beautiful Soup常用操作

1 bs4 tag.contents 將標籤轉化為list 2 soup.prettify 將soup中的內容以標籤的形式列印出來 3 呼叫tag的 find all 方法時,beautiful soup會檢索當前tag的所有子孫節點,如果只想搜尋tag的直接子節點,可以使用引數 recursive...

BeautifulSoup 常用方法

輸出所得標籤的 屬性值獲取 head裡面的第乙個meta的content值 soup.head.meta content 獲取第乙個span的內容 soup.span.string獲取第乙個span的內容soup.span.text name屬性叫keywords 所有物件soup.find all...

爬蟲 Beautifulsoup 常用筆記

soup.find返回的是乙個物件,第乙個符合條件的標籤 soup.findall返回的是乙個列表,包含所有符合條件的標籤 所以find後面可以直接接get text函式,而findall不行,只能將findall列表中的元素,單獨地去get text 例如 from urllib.request ...