Beautiful Soup常用操作

2021-08-29 18:21:18 字數 371 閱讀 4411

1、bs4_tag.contents 將標籤轉化為list

2、soup.prettify()  將soup中的內容以標籤的形式列印出來

3、呼叫tag的 find_all() 方法時,beautiful soup會檢索當前tag的所有子孫節點,如果只想搜尋tag的直接子節點,可以使用引數 recursive=false

一段簡單的文件:

是否使用 recursive 引數的搜尋結果:

soup.html.find_all("title")

# [the dormouse's story]

soup.html.find_all("title", recursive=false)

#

BeautifulSoup常用方法

1.初始化 2.查詢指定標籤 eg 要找到符合的所有標籤 p.findall div 反覆利用標籤特徵可以找到最終需要的標籤 3.直接加標籤名可以找到所有子標籤 eg 找到所有標籤 p.td 4.直接以字典形式,可以訪問標籤內對應屬性的值 eg 要找到 中href 的值 www.csdn.net p...

BeautifulSoup 常用方法

輸出所得標籤的 屬性值獲取 head裡面的第乙個meta的content值 soup.head.meta content 獲取第乙個span的內容 soup.span.string獲取第乙個span的內容soup.span.text name屬性叫keywords 所有物件soup.find all...

爬蟲 Beautifulsoup 常用筆記

soup.find返回的是乙個物件,第乙個符合條件的標籤 soup.findall返回的是乙個列表,包含所有符合條件的標籤 所以find後面可以直接接get text函式,而findall不行,只能將findall列表中的元素,單獨地去get text 例如 from urllib.request ...