beautiful soup解析有空格的class

2022-05-26 03:12:07 字數 351 閱讀 9906

用python寫乙個爬蟲,用beautifulsoup解析html。

其中乙個地方需要抓取下面兩類標籤:

blabla1

blabla2

第一類class的值的末尾有乙個空格。

第二類class的值中間有乙個空格,而且開頭部分和第一類相同。

在css中,class的值不應該有空格,所以第一類會忽略空格,第二類會被當做多值屬性。參考官方文件多值屬性。

所以在處理時也不需再考慮class值中的空格。

傳入引數時用列表過濾器是最方便的,如下:

soup.find_all("dd", class_= ["ab", "cd"])

BeautifulSoup解析資料

4 基本操作 coding utf 8 author wengwenyu from bs4 import beautifulsoup fp open soup text.html encoding utf 8 soup beautifulsoup fp,lxml print soup 根據標籤名進行...

資料解析 BeautifulSoup

bs4資料解析 例項化乙個beautifulsoup物件,並且將頁面遠嗎載入到該物件中。通過呼叫beautifulsoup物件中相關屬性方法進行標籤定位,資料提取。pip install bs4 pip install lxml 解析器 下面介紹乙個是從本地html文件中載入beautifulsou...

BeautifulSoup解析xml檔案的使用初步

借助拉手網的開放api藉口,獲取特定城市的當日 資料 列印響應 獲取每個店鋪的短標題和購買數量 print each.data.display.shorttitle.text,each.data.display.bought.text if name main fetch 沒有和etree.elem...