xpath文件詳解

2021-07-14 07:58:09 字數 1211 閱讀 2484

基本的xpath語法類似於在乙個檔案系統中定位檔案,如果路徑以斜線 / 開始, 那麼該路徑就表示到乙個元素的絕對路徑:

/aaa

選擇根元素aaa

/aaa/ccc

選擇aaa 的所有ccc子元素

//bbb

選擇所有bbb元素

//ddd/bbb

選擇所有父元素是ddd的bbb元素

星號 * 表示選擇所有由星號之前的路徑所定位的元素

/aaa/ccc/ddd/*

選擇所有路徑依附於/aaa/ccc/ddd 的元素

/*/*/*/bbb

選擇所有的有3個祖先元素的bbb元素

選擇所有元素

/aaa/bbb[1]

選擇aaa 的第乙個bbb子元素

/aaa/bbb[last()]

選擇aaa 的最後乙個bbb子元素

//@id

選擇所有的id屬性

//bbb[@name]

選擇有name屬性的bbb元素

//bbb[@*]

選擇有任意屬性的bbb元素

//bbb[@id='b1']

選擇含有屬性id且其值為'b1'的bbb元素

//bbb[@name='bbb']

選擇含有屬性name且其值為'bbb'的bbb元素

//bbb[normalize-space(@name)='bbb']

選擇含有屬性name且其值(在用normalize-space函式去掉前後空格後)為'bbb'的bbb元素

//*[count(bbb)=2]

選擇含有2個bbb子元素的元素

//*[string-length(name()) = 3]

選擇名字長度為3的元素

//ccc | //bbb

選擇所有的ccc和bbb元素

/aaa

等價於 /child::aaa

/descendant::*

選擇文件根元素的所有後代.即所有的元素被選擇

/aaa/bbb/descendant::*

選擇/aaa/bbb 的所有後代元素

//ddd/parent::*

選擇ddd元素的所有父節點

< bbb/>

< ccc/>

< bbb/>

< bbb/>

< ddd>

< bbb/> 

< ccc/>

xpath用法詳解

選擇不包含class屬性的節點 result article.xpath span not class 選擇不包含class和id屬性的節點 result article.xpath span not class and not id 選擇不包含class expire 的span result a...

詳解xpath定位

xpath定位 1 通過開發者工具直接copy 右擊copy copy xpath 2 串聯的方式定位元素 3 通過父元素定位子元素 from selenium import webdriver from time import sleep driver webdriver.chrome drive...

使用 XPath 解析 HTML 文件

原文 使用xpath解析html文件 xpath 的全稱是 xml path language,即 xml 路徑語言,它是一種在結構化文件 比如 xml 和 html 文件 中定位資訊的語言,關於 xpath 的介紹可以參考 後面我們將以下面的 html 文件介紹 xpath 的使用。下表是 xpa...