XPath簡單介紹

一、xpath即為xml路徑語言，它是一種用來確定xml（標準通用標記語言的子集）文件中某部分位置的語言。xpath基於xml的樹狀結構，提供在資料結構樹中找尋節點的能力，被開發者採用來當作小型查詢語言。

1、在 xpath 中，有七種型別的節點：元素、屬性、文字、命名空間、處理指令、注釋以及文件（根）節點。

1）節點（node）

xml 文件是被作為節點樹來對待的。樹的根被稱為文件節點或者根節點。

<?xml version="1.0" encoding="iso-8859-1"?>
lang="en">harry pottertitle>
j k. rowlingauthor>
2005year>
29.99price>
book>
bookstore>

上面的xml文件中的節點例子：

（文件節點） j k. rowlingauthor> （元素節點）

lang="en" （屬性節點）

2）基本值（或稱原子值，atomic value）

基本值是無父或無子的節點。

基本值的例子：

j k. rowling

"en"

3）專案（item）

專案是基本值或者節點。

2、節點關係

父（parent）: 每個元素以及屬性都有乙個父。

子（children）: 元素節點可有零個、乙個或多個子。

同胞（sibling）: 擁有相同的父的節點。

先輩（ancestor）：某節點的父、父的父，等等。

後代（descendant）：某個節點的子，子的子，等等。

二、xpath 使用路徑表示式來選取 xml 文件中的節點或節點集。節點是通過沿著路徑 (path) 或者步 (steps) 來選取的。

表示式描述nodename

選取此節點的所有子節點。

/從根節點擊取。

//從匹配選擇的當前節點擊擇文件中的節點，而不考慮它們的位置。

.選取當前節點。

..選取當前節點的父節點。

@選取屬性。

<?xml version="1.0" encoding="iso-8859-1"?>
lang="eng">harry pottertitle>
29.99price>
book>
lang="eng">learning xmltitle>
39.95price>
book>
bookstore>

路徑表示式

結果bookstore

選取 bookstore 元素的所有子節點。

/bookstore

選取根元素 bookstore。

注釋：假如路徑起始於正斜槓( / )，則此路徑始終代表到某元素的絕對路徑！

bookstore/book

選取屬於 bookstore 的子元素的所有 book 元素。

//book

選取所有 book 子元素，而不管它們在文件中的位置。

bookstore//book

選擇屬於 bookstore 元素的後代的所有 book 元素，而不管它們位於 bookstore 之下的什麼位置。

//@lang

選取名為 lang 的所有屬性。

徑表示式

結果/bookstore/book[1]

選取屬於 bookstore 子元素的第乙個 book 元素。

/bookstore/book[last()]

選取屬於 bookstore 子元素的最後乙個 book 元素。

/bookstore/book[last()-1]

選取屬於 bookstore 子元素的倒數第二個 book 元素。

/bookstore/book[position()<3]

選取最前面的兩個屬於 bookstore 元素的子元素的 book 元素。

//title[@lang]

選取所有擁有名為 lang 的屬性的 title 元素。

//title[@lang=』eng』]

選取所有 title 元素，且這些元素擁有值為 eng 的 lang 屬性。

/bookstore/book[price>35.00]

選取 bookstore 元素的所有 book 元素，且其中的 price 元素的值須大於 35.00。

/bookstore/book[price>35.00]/title

選取 bookstore 元素中的 book 元素的所有 title 元素，且其中的 price 元素的值須大於 35.00。

萬用字元描述

*匹配任何元素節點。

@*匹配任何屬性節點。

node()

匹配任何型別的節點。如：

路徑表示式

結果/bookstore/*

選取 bookstore 元素的所有子元素。

//*選取文件中的所有元素。

//title[@*]

選取所有帶有屬性的 title 元素。

/bookstore/book/title | //price

選取屬於 bookstore 元素的 book 元素的所有 title 元素，以及文件中所有的 price 元素。

軸名稱結果

ancestor

選取當前節點的所有先輩（父、祖父等）。

ancestor-or-self

選取當前節點的所有先輩（父、祖父等）以及當前節點本身。

attribute

選取當前節點的所有屬性。

child

選取當前節點的所有子元素。

descendant

選取當前節點的所有後代元素（子、孫等）。

descendant-or-self

選取當前節點的所有後代元素（子、孫等）以及當前節點本身。

following

選取文件中當前節點的結束標籤之後的所有節點。

namespace

選取當前節點的所有命名空間節點。

parent

選取當前節點的父節點。

preceding

選取文件中當前節點的開始標籤之前的所有節點。

preceding-sibling

選取當前節點之前的所有同級節點。

self

選取當前節點。

ancestor::book

選擇當前節點的所有 book 先輩。

ancestor-or-self::book

選取當前節點的所有 book 先輩以及當前節點（如果此節點是 book 節點）

child::*/child::price

選取當前節點的所有 price孫節點。

XPath的簡單介紹以及使用

xpath 是一門在 xml 文件中查詢資訊的語言。xpath它可以用來在 xml 文件中對元素和屬性進行遍歷。要使用xpath首先需要安裝lxml，在終端輸入如下命令即可 pip install lxml 什麼是xpath？首先先來介紹下xml，它是用來儲存和傳輸資料使用的。和html的不同有以下...

xpath常用介紹

介紹下什麼是xpath 1.xpath使用路徑表示式在xml和html中進行導航 2.xpath中包含了一些標準函式庫 3.xpath是乙個w3c的標準 xpath中可以像css的選擇器一樣使用，能夠在頁面頁面當中選擇出來想要選擇的元素下面列出了一些xpath的常用的選擇 article 選取所有...

XPath 簡單語法

xpath 是xml的查詢語言，和sql的角色很類似。以下面xml為例，介紹xpath 的語法。empire burlesque bob dylan 10.90 hide your heart bonnie tyler 9.90 greatest hits dolly parton 9.90 定位節...

XPath簡單介紹

XPath的簡單介紹以及使用

xpath常用介紹

XPath 簡單語法

相關推薦