xpath語言使用

2021-08-06 06:31:00 字數 956 閱讀 1259

xpath是一門語言,可以在xml文件中查詢資訊,在爬蟲中比正規表示式方便很多;

xpath是屬於lxml庫,安裝xpath首先需要安裝python第三方庫lxml庫檔案;

from lxml import etree

selector = etree.html(html1) ####html1是頁面源**

selector.xpath

對於網頁選擇,我們可以使用手動查詢,也可也使用chrome右鍵查詢xpath

xpath提取內容:

(1)   //定位根節點

(2)   /往下層尋找

(3)   /text()提取文字內容

(4)   /@***提取屬性內容

(5)  特殊用法 start-with  如:

haha

zgdscx

可以寫成content =selector.xpath( '//div[start-with(@id,"test")]/text()'),

其實我們也可以找到上一級目錄,然後定位到div,然後再遍歷也能解決問題。

(6)  特殊string(.)

html2 = '''

我左青龍,

右白虎,

老牛在當中,

龍頭在胸口。

data = selector.xpath('//div[@id="test3"]')[0]  

info = data.xpath('string(.)')

content = info.replace('\n', ' ').replace(' ' , ' ' )

上面**能提取出所有的文字。

如果使用data = selector.xpath('//div[@id="test3"]/text()')只能提取出

我左青龍,
龍頭在胸口。
對於內部的內容是不能提取出的。

XPath使用總結

xpath xpath常用規則 text from lxml import etree selector etree.html text result selector.xpath print result 輸出 from lxml import etree selector etree.html ...

Xpath使用教程

xpath xml path language 是一門在xml和html文件中查詢資訊的語言,可用來在xml和html文件中對元素和屬性進行遍歷.chrome外掛程式xpath helper.firefox外掛程式xpath checker和try xpath 使用 獲取整個介面當中的元素,然後寫簽...

XPath語法 在C 中使用XPath示例

xpath可以快速定位到xml中的節點或者屬性。xpath語法很簡單,但是強大夠用,它也是使用xslt的基礎知識。示例xml 100this is a black cat 80this is a white cat 80this is a yellow cat 100this is a black ...