後浪小萌新Python XPath的使用

2021-10-24 07:14:16 字數 2344 閱讀 3801

xpath是專門用來解析xml資料格式的資料的。(採用直接分析節點的方式解析資料)

xml資料

注意:xml和json一樣都是屬於資料格式,用來進行資料的傳遞的資料格式。json的優點輕,佔頻寬小;xml傳統、老牌、資料加密方便

xml資料格式: 像html一樣通過節點來儲存資料

概念

表示式描述

節點《節點名》

根節點最外層的節點

屬性和html標籤屬性一樣

內容節點中間的資料

xpath資料解析

通過路徑表示式在 xml 文件中選取節點

python使用xpath語法解析xml資料需要乙個第三方庫: lxml

注意:先建立樹獲取根節點 - etree.xml(xml)

使用xpath獲取指定節點 - 節點物件.xpath(路徑)

選取節點

xpath 使用路徑表示式在 xml 文件中選取節點。節點是通過沿著路徑或者 step 來選取的。

表示式描述

節點名稱

選取此節點的所有子節點。

/從根節點擊取。(絕對路徑)

//提取任意子節點(從匹配選擇的當前節點擊擇文件中的節點,而不考慮它們的位置。)

.選取當前節點。

…選取當前節點的父節點。

@選取屬性。

例項:路徑表示式

結果bookstore

選取 bookstore 元素的所有子節點。

/bookstore

選取根元素 bookstore。注釋:假如路徑起始於正斜槓( / ),則此路徑始終代表到某元素的絕對路徑!

bookstore/book

選取屬於 bookstore 的子元素的所有 book 元素。

//book

選取所有 book 子元素,而不管它們在文件中的位置。

bookstore//book

選擇屬於 bookstore 元素的後代的所有 book 元素,而不管它們位於 bookstore 之下的什麼位置。

//@lang

選取名為 lang 的所有屬性

謂語謂語用來查詢某個特定的節點或者包含某個指定的值的節點。

謂語被嵌在方括號中。

路徑表示式

結果/bookstore/book[1]

選取屬於 bookstore 子元素的第乙個 book 元素。

/bookstore/book[last()]

選取屬於 bookstore 子元素的最後乙個 book 元素。

/bookstore/book[last()-1]

選取屬於 bookstore 子元素的倒數第二個 book 元素。

/bookstore/book[position()❤️]

選取最前面的兩個屬於 bookstore 元素的子元素的 book 元素。

//title[@lang]

選取所有擁有名為 lang 的屬性的 title 元素。

//title[@lang=『eng』]

選取所有 title 元素,且這些元素擁有值為 eng 的 lang 屬性。

/bookstore/book[price>35.00]

選取 bookstore 元素的所有 book 元素,且其中的 price 元素的值須大於 35.00。

/bookstore/book[price>35.00]/title

選取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值須大於 35.00。

選取未知節點

xpath 萬用字元可用來選取未知的 xml 元素。

萬用字元描述

*匹配任何元素節點

@*匹配任何屬性節點。

node()

匹配任何型別的節點

例項:路徑表示式

結果/bookstore/*

選取 bookstore 元素的所有子元素。

//*選取文件中的所有元素。

//title[@*]

選取所有帶有屬性的 title 元素。

選取若干路徑

通過在路徑表示式中使用「|」運算子,您可以選取若干個路徑。

路徑表示式

結果//book/title|//book/price

選取 book 元素的所有 title 和 price 元素。

//title|//price

選取文件中的所有 title 和 price 元素。

/bookstore/book/title|//pric

選取屬於 bookstore 元素的 book 元素的所有 title 元素,以及文件中所有的 price 元素。

後浪小萌新HTML css基礎

css cascading style sheets 層疊樣式表 css是web標準中的表現標準,主要用來設定網頁內容的樣式和布局 給標籤化妝 內聯樣式表 將樣式表 css 寫在標籤的style屬性中 樣式只能作用於乙個標籤 內部樣式表 將樣式表寫在style標籤中 樣式只能作用於當前html檔案中...

後浪小萌新Python CSV檔案

csv是一種用逗號將一行資料隔開的文字檔案,這種檔案可以用 來開啟。多用於資料處理中資料的提供和儲存 python的標準庫中有乙個csv庫,專門用來提供和csv檔案操作相關功能 寫資料 csv檔案的寫操作方式1 以列表的形式寫入資料 寫物件 csv.writer csv檔案物件 寫物件.writer...

後浪小萌新Python 基礎語法

注釋就是 中說明性的文字,不參與程式的編譯執行 不影響程式的功能 單行注釋 在一行說明性文字前加 這是第一行注釋 這是第二行注釋 這是第三行注釋執行如下 多行注釋 將注釋內容寫在三個單引號或者三個雙引號之間 這是第一行注釋 這是第二行注釋 這是第三行注釋 注 為了防止轉譯,加了縮排,在python中...