Xpath使用方法

2022-01-10 19:31:01 字數 1335 閱讀 4901

什麼是xpath?

xpath是xml的路徑語言,通俗一點講就是通過元素的路徑來查詢到這個標籤元素。

工具

xpath使用方法

注:預設死格式 先寫 //* 代表定位頁面下所有元素

1、xpath支援id、class、name定位功能

1)、通過id定位

//*[@id='kw']

2)、通過class定位

//*[@class='class_name']

3)、通過name定位

//*[@name='name']

2、如果標籤沒有id、class、name三總屬性,xpath還支援屬性定位功能

@代表以屬性定位,後面可以接標籤中任意屬性

//*[@other='attribute']

3、當標籤的屬性重複時,xpath提供了通過標籤來進行過濾

將*換位任意標籤名,則可根據標籤進行篩選

//input[@placeholder='使用者名稱']

4、當標籤頁重複時,xpath提供了層級過濾

例如:找不到兒子,那麼就先找他的爸爸,實在不行可以再找他的爺爺

1)、支援通過/進行層級遞進,找到符合層級關係的標籤

//form/div/input[@placeholder="使用者名稱"]

2)、當層級都重複時,可以通過單個層級的屬性進行定位

//form/div[@class='login-user']/input

5、乙個元素它的兄弟元素跟它的標籤一樣,這時候無法通過層級定位到。因為都是乙個父親生的,多胞胎兄弟。xpath提供了索引過濾

通過索引,在list中定位屬性,與python的索引有些差別,xpath從1開始

//select[@name='city'][1]/option[1]

6、上面幾種如果都用上了之後還重複的話,我們就可以使用xpath提供的終極神器,邏輯運算定位。and 或 or

1)、通過and來縮小過濾的範圍,只有條件都符合時才能定位到

//select[@name='city'and@size='4'and@multiple="multiple"]

2)、or就相反了,只要這些篩選中,其中乙個出現那麼久匹配到了

//select[@name='city'or@size='4']

我通常把xpath看成是屠龍刀。武林至尊,寶刀xpath,css不出,誰與爭鋒?

xpath與css基本使用方法

1 工具firefox50版本以下,安裝外掛程式firebug firepath 2 使用方法 表示式描述 從根節點擊取 從匹配選擇的當前節點擊擇文件中的節點,而不考慮它們的位置 代表獲取全部元素 id i1 代表屬性定位,選擇所有的屬性中且標籤id等於i1的元素 placeholder 請通過id...

Scrapy下xpath基本的使用方法

scrapy是基於python的開源爬蟲框架,使用起來也比較方便。具體的官網檔 之前以為了解python就可以直接爬 了,原來還要了解html,xml的基本協議,在了解基礎以後,在了解下xpath的基礎上,再使用正規表示式 python下的re包提供支援 提取一定格式的資訊 比如說url 就比較容易...

網頁採集中Xpath簡單使用方法

xpath在簡數採集平台中是定位獲取頁面html標籤或者標籤中的內容。例子 html body p a 上面xpath路徑意思是獲取html標籤下的子標籤body,body下的子標籤p,p下的子標籤a,獲取結果是對應下圖的第10行a標籤 例子 html body p a 上面xpath路徑意思是獲取...