學習爬蟲第五天 xpath

2021-10-02 06:20:16 字數 1417 閱讀 4149

xpath是⼀⻔在html/xml⽂檔中查詢資訊的語⾔,可⽤來在html/xml⽂檔中對元素和屬性進⾏遍歷

文件:xpath介紹

xml:

html:

概念:每個xml的標籤我們都稱之為節點。

示例:

>

>hello world>

>juran>

>2019>

>

定義:xpath使⽤路徑表示式來選取xml⽂檔中的接待或者節點集。這些路徑表示式和我們在常規的電腦⽂件系統中看到的表示式⾮常相似。

表示式描述

/從根節點擊取

//從匹配選擇的當前節點擊擇文件中的節點,而不考慮他們的位置

.選取當前節點

…選取當前節點的父節點@選取

路徑表示式

結果/bookstore/book[1]

選取屬於 bookstore ⼦元素的第⼀個book 元素。

/bookstore/book[last()]

選取屬於 bookstore ⼦元素的最後⼀個 book 元素。

/bookstore/book[last()-1]

選取屬於 bookstore ⼦元素的倒數第⼆個 book 元素。

/bookstore/book[position()< 3]

選取最前⾯的兩個屬於 bookstore 元素的⼦元素的 book 元素。

//title[@lang]

選取所有擁有名為 lang 的屬性的title 元素。

//title[@lang=『eng』]

選取所有 title 元素,且這些元素擁有值為eng和lang屬性

/bookstore/book[price>35.00]

選取 bookstore 元素的所有 book元素,且其中的 price 元素的值須⼤於 35.00。

xpath 萬用字元可⽤來選取未知的 xml 元素。

萬用字元描述

*匹配任何元素節點

@*匹配任何屬性節點

node()

匹配任何型別的節點

常見路徑表示式,及表示式結果:

路徑表示式

結果/bookstore/*

選取 bookstore 元素的所有⼦元素。

//*選取⽂檔中的所有元素。

html/node()/meta/@*

選擇html下⾯任意節點下的meta節點的所有屬性

//title[@*]

選取所有帶有屬性的 title 元素。

xpath的更多語法:更多語法

Python爬蟲的第五天 XPath

xpath即為xml路徑語言 xml path language 它是一種用來確定xml文件中某部分位置的計算機語言。選取節點 xpath使用路徑表示式來選取xml文件中的節點或者節點集。一些語法 表示式描述示例結果 選取此節點的所有子節點 html 選取html下的所有子節點 注意 只能是子節點,...

學習第五天

清楚測試用例是什麼 測試用例的重要性 有效性 測試用例是測試人員測試過程中的重要參考依據,準確的測試用例的計畫 執行和跟蹤是 測試的有效性的有力證明 可復用性 設計良好的測試用例可以重複執行,能節約時間,提高測試效率 易組織性 清晰詳細的測試用例能夠便於測試執行的開展 可評估性 測試用例的通過率是檢...

Java學習第五天

當類載入器需要載入某個類時,類載入器會在載入初始化後生成該類的乙個類物件 class 用於描述該類的元資料資訊等。在其後的連線過程中,會初始化該類的靜態成員 變數或靜態初始化器 靜態初始化變數和初始化器按照先後順序執行初始化。例如 static int a 10 static 這樣初始化後a 100...