第四講 Xpath語法

2021-10-08 01:55:00 字數 2287 閱讀 4130

(一)什麼是 xml

(二)xml 和 html 的區別

名詞解釋:與html對應,需要自己命名,標籤嚴格閉合(即上下對應)

(三)xml的節點關係

參考html的節點關係:

xpath (xml path language) 是一門在 xml 文件中查詢資訊的語言,可用來在 xml 文件中對元素和屬性進行遍歷。

(一) 選取節點

xpath 使用路徑表示式來選取 xml 文件中的節點或者節點集。這些路徑表示式和我們在常規的電腦檔案系統中看到的表示式非常相似。下面列出了最常用的路徑表示式:

(二) 謂語(predicates)

謂語用來查詢某個特定的節點或者包含某個指定的值的節點,被嵌在方括號中。

(一)lxml簡介與安裝

lxml 是乙個 html/xml 的解析器,主要的功能是如何解析和提取 html/xml 資料。我們可以利用之前學習的 xpath 語法,來快速的定位特定元素以及節點資訊。

安裝方法:

pip install lxml
(二)lxml 初步使用1、解析html字串

2、lxml檔案讀取

3、xpath節點資訊解析

"""# 初始化乙個xpath解析物件

html = etree.html(text)

# 解析物件輸出** 是乙個bytes型別

result = etree.tostring(html,encoding='utf-8')

# print(type(html)) # # print(type(result)) # # print(result.decode('utf-8'))

# 獲取所有的標籤

# print(html.xpath('//li'))

# 獲取標籤的所有class屬性

# print(html.xpath('//li/@class'))

# 獲取標籤下href為link1.html的標籤

# print(html.xpath('//li/a[@href="link1.html"]')[0])

# 獲取標籤下的所有標籤(包括孫子span)

# print(html.xpath('//li//span'))

# 獲取標籤下的標籤裡的所有class

# print(html.xpath('//li/a/@class'))

# 獲取最後乙個的的href

# print(html.xpath('//li[last()]/a/@href'))

# 獲取倒數第二個元素的內容

# print(html.xpath('//*[last()-1]/text()'))

# 獲取class值為aa的標籤名

# print(html.xpath('//*[@class="aa"]'))

具體案例請看下文:第四講案例

視覺SLAM十四講第四講

主要目標 理解李群與李代數的概念,掌握 so 3 se 3 與對應李代數的表示方式。理解 bch 近似的意義。學會在李代數上的擾動模型。使用 sophus 對李代數進行運算。旋轉矩陣自身是帶有約束的 正交且行列式為 1 它們作為優化變數時,會引入額外的約束,使優化變得困難。通過李群 李代數間的轉換關...

Python學習第四講

運算子比較運算子 邏輯運算子 split 分割字串 例 split 點前面一般是變數,括號內是分割的字元 join 拼接字串 例 join 點前面是拼接的字元 一般用變數形式 括號內是變數 strip 左右兩邊去空格 lstrip 左邊去空格 rstrip 右邊去空格 字串內建方法的表示 含義spl...

WINFORM 第四講(布局)

布局 一 預設布局 空布局 1.location 位置 x y軸來調整位置 2.anchor 固定邊距 想要固定哪一邊的邊距 就把那邊的點黑 記得回車確定 如果四周都選中 都點黑 拖動時候中間的按鈕會被拉伸 四個邊都不固定 則按鈕居中 二 邊界布局 dock 上右下左中 上下 高度不變寬度改變 左右...