Python爬蟲第一課,選取標籤內容

2021-10-03 14:21:34 字數 1368 閱讀 2929

獲取標題`# from urllib.request import urlopen

獲取標籤特定問內容,get_text

findall(tag, attributes, recursive, text, limit, keywords)

find(tag, attributes, recursive, text, keywords)

.findall()獲取所有標籤的所有內容

.findall(「span」, })獲取指定標籤指定內容

recursive 設定為 true , findall 就會根據你的要求去查詢標籤引數的所有子標籤,如果 recursive 設定為 false , findall 就只查詢文件的一級標籤,findall預設是支援遞迴查詢的( recursive 預設值是 true )。

範圍限制引數 limit ,顯然只用於 findall 方法。 find 其實等價於 findall 的 limit 等於1 時的情形。

` from urllib.request import urlopen

from bs4 import beautifulsoup

html = urlopen(「

bsobj = beautifulsoup(html)

list = bsobj.findall(id = 「text」)

namelist = bsobj.findall(「span」,)

for name in namelist :

print(name.get_text())

for a in list :

print(a.get_text())`

分享就到這裡!本文內容提取自python網路採集!

Python爬蟲筆記 爬蟲基礎第一課

0.獲取資料 爬蟲程式會根據我們提供的 向伺服器發起請求,然後返回資料。1.解析資料 爬蟲程式會把伺服器返回的資料解析成我們能讀懂的格式。2.提取資料 爬蟲程式再從中提取出我們需要的資料。3.儲存資料 爬蟲程式把這些有用的資料儲存起來。屬性 作用response.status code 檢查請求是否...

python自學 第一課

內容 安裝 簡單執行 2 cmd進入命令視窗,跳轉到d盤 linux渣,糾結很久怎麼進入d盤,其實只要簡單的輸入 d 就可以 進入磁碟以下的檔案目錄 才用 cd,比如我進入python環境的 命令 cd d python27 3 執行python 其一 直接的在視窗輸入命令 其二 注意 第一行必須注...

python學習第一課

1.單行注釋 2.或 多行注釋運算子的型別運算子的優先順序運算子tips 參考變數型別 算術運算子 print 1 1 2,加 print 2 1 1,減 print 3 4 12,乘 print 3 4 0.75,除 print 3 4 0,整除 地板除 print 3 4 3,取餘 print ...