關於pyquery的應用

2021-10-02 10:43:52 字數 1066 閱讀 9176

html = '''

'''from pyq

ery import pyquery as pq

doc = pq(html)

這表明doc是乙個pyquery的物件,對html進行了pyquery處理

查詢方法和之前的beautifulsoup一樣,doc(『li』)表示查詢標籤為li的,doc(』.item-1』)表示查詢包含屬性為class=item-1的標籤,並返回標籤內容

li=doc('li')

li.children()

li.parent()

li.parents()

li.siblings()

可以分別查詢li的子節點,li的父節點,li的父節點和祖先節點,li的兄弟節點

li=doc('li').items

for a in li:

print(a)

通過.items的操作,把找到(『li』)的標籤內容放進生成器中,然後通過for迴圈進行提取

li.attr('class')

li.attr('name','nora')

li.attr('class','wife')

li.css('name','guo')

通過.attr(『class』)的操作可以獲得屬性為『class』的內容,通過.attr(『class』,『wife』)的操作可以更改屬性的內容,若標籤內沒有此屬性,則新增此屬性。通過css(『name』,『guo』)的操作可以新增乙個style屬性

li.text()

li('a').attr('href')

通過li.text()可以獲得li內的所有文字資訊。li本身的標籤沒有』href』屬性,但是它的子標籤『a』有,所有可以通過li(『a』).attr(『href』)的方式獲得子標籤內的屬性

li.find('a').remove
通過這個操作可以把li內的a標籤內容移除掉

pyquery庫的使用

pyquery標籤選擇 獲取了所有的img標籤 css選擇器,你也可以換成不同的class和id 1 import requests 2importre3 from pyquery import pyquery as pq 4 headers 11 response requests.get hea...

PyQuery庫的使用

html from pyquery import pyquery as pq doc pq html print doc print type doc print doc li 由於pyquery寫起來比較麻煩,所以我們匯入的時候都會新增別名 from pyquery import pyquery ...

PyQuery庫的使用(下篇)

3.41 單個元素輸出 html 清空 from pyquery import pyquery doc pyquery html print doc input 輸出input標籤 3.42 遍歷元素輸出 html 清空 from pyquery import pyquery doc pyquery...