bs4 遍歷文件樹

2021-10-13 07:14:49 字數 922 閱讀 3992

from bs4 import beautifulsoup

html =

"""first item

second item

third item

>

"""soup = beautifulsoup(html,

'lxml'

)ui = soup.ui

print

(ui.contents)

#返回列表

print

(ui.children)

#返回迭代器

for i in ui.children:

print

(i)for string in soup.strings:

print

(string)

print

(repr

(string)

)for string in soup.stripped_strings:

print

(string)

print

(repr

(string)

)

contents和children的區別

返回某個標籤下的直接子元素,其中也包括字串。

區別是:contents返回的是乙個列表,children返回的是乙個迭代器。

string和strings、stripped_strings屬性

1、string:獲取某個標籤下的非標籤字串。返回的是字串。如果這個標籤下有多行字串,那麼就不能獲取。

2、strings:獲取某個標籤下的子孫非標籤字串。返回的是生成器。

3、stripped_strings:獲取某個標籤下的子孫非標籤字串,會去掉空白字元,返回的是生成器。

bs4的用法之遍歷文件樹以及查詢文件樹

bs4的用法之遍歷文件樹以及查詢文件樹 bs4的使用 from bs4 import beautifulsoup html doc the dormouse s story once upon a time there were three little sisters and their name...

bs4之標籤樹的下行遍歷

import requests from bs4 import beautifulsoup def bianlisoup url r requests.get url,timeout 30 r.raise for status demo r.text soup beautifulsoup demo,...

Python3 遍歷目錄樹

假定你希望對某個資料夾中的所有檔案改名,包括該資料夾中所有子資料夾中 的所有檔案。也就是說,你希望遍歷目錄樹,處理遇到的每個檔案。寫程式完成這 件事,可能需要一些技巧。好在,python 提供了乙個函式,替你處理這個過程。import os for foldername,subfolders,fil...