xpath解析基礎

2022-04-10 12:59:46 字數 762 閱讀 2374

import

requests

from lxml import

etree

if__name__ == "

__main__":

headers =

#ua偽裝

#例項化好了乙個etree物件,且將被解析的檔案載入到了物件中

tree = etree.parse('

test.html')

#r = tree.xpath('/html/body/div') # '/html'中'/'從根目錄(根節點)

#r1 = tree.xpath('/html//div') # '//'表示示的是多個層級

#r2 = tree.xpath('//div') # '//'表示的是多個層級

#r = tree.xpath('//div[@class="song"]')

#r = tree.xpath('//div[@class="song"]/p[3]') # 索引定位從1開始

#r = tree.xpath('//div[@class="tang"]//li[5]/a/text()')[0] # 索引定位從1開始

#r = tree.xpath('//div[@class="tang"]//li[7]//text()')[0] # 索引定位從1開始

r = tree.xpath('

//div[@class="song"]/img/@src

')#索引定位從1開始

print(r)

xpath解析基礎

xpath解析 最常用且最便捷高校的一種解析方式。通用性。xpath解析原理 1.例項化乙個etree的物件,且需要將被解析的頁面原始碼資料載入到該物件中。2.呼叫etree物件中的xpath方法結合著xpath表示式實現標籤的定位和內容的捕獲。環境的安裝 pip install lxml 如何例項...

Xpath解析資料

xpath,xml path language。是一種小型的查詢語言,是一門在xml文件中查詢的語言。優點 可以在xml中查詢資訊 支援html的查詢 可通過元素和屬性進行導航。xpath的樹形結構 使用xpath選取節點 表示式描述nodename 選取此節點的所有子節點 從根節點擊擇 從匹配選擇...

解析網頁之xpath解析

xpath指的是使用路徑表示式在 xml 文件中查詢資訊的語言。xpath的七個節點術語 元素 屬性 文字 命名空間 處理指令 注釋以及文件 根 節點。每個元素以及屬性都有乙個父節點。元素節點可有零個 乙個或多個子節點。就好像每一片樹葉都只能在一根樹枝上,但每一根樹枝卻有很多樹葉。以此類推,樹幹是所...