pyquery解析庫提取資料特例

2021-10-07 01:24:14 字數 1093 閱讀 2864

豆瓣top250中提取評價人數:

text=

'''9.7

2029026人評價

'''

doc = pyquery(text)

doc(

'.star span'

).eq(-1

).text(

)#pyquery.eq(index)用於同名標籤篩選,index從0開始,-1表最後乙個

# doc('.star span:last-child').text() 也可達到效果,第乙個節點first-child,第n(n>1)個節點nth-child(n)

豆瓣top250中提取「導演,演員,上映時間,地區,類別」

可以看到,第乙個p標籤的class屬性沒有值,實際就是,另外br標籤看起來不完整,不管它,直接從p標籤提取文字看看結果。

定位p的父標籤如,再選擇第乙個p標籤,item.find(『p』).eq(0)。先text().split(』 『)輸出看一下結果列表有哪些字串元素,再進行詳細提取。該例text()結果含有拉丁空格\xa0和換行\n,可據此進行split(』\n』)和split(』\xa0』)切片提取即可。

#試著提取導演和上映時間

doc = pq(text)

#pq:pyquery

position = doc(

'.bd p'

).eq(0)

.text(

).split(

'\n')[

0].split(

'\xa0')[

0]time = doc(

'.bd p'

).eq(0)

.text(

).split(

'\n')[

1].split(

'/')[1

].strip(

)

Python資料提取 PyQuery

1.1 介紹 如果你對css選擇器與jquery有有所了解,那麼還有個解析庫可以適合你 jquery 官網 1.2 安裝pip install pyquery 1.3 使用方式 1.3.1 初始化方式 from pyquery import pyquery as pq doc pq str prin...

08 資料提取 PyQuery

1.1 介紹 如果你對css選擇器與jquery有有所了解,那麼還有個解析庫可以適合你 jquery 官網 1.2 安裝pip install pyquery 1.3 使用方式 1.3.1 初始化方式 from pyquery import pyquery as pq doc pq str prin...

python解析庫詳解 PyQuery庫詳解

通過這篇文章為大家介紹崔慶才老師對python爬蟲pyquery庫的講解,包括基本原理及其理論知識點 目錄 一 什麼是pyquery庫?二 安裝 三 pyquery庫用法詳解 一 什麼是pyquery庫?強大而靈活的網頁解析庫。如果你覺得正則寫起來太麻煩,如果你覺得beautifulsoup語法太難...