如何在Urllib中使用XPath表示式

2021-09-27 12:09:54 字數 894 閱讀 6106

nodename 	 選取此節點的所有子節點  

/ 逐層提取

text() 提取標籤下的文字內容

//標籤名 提取所有此標籤名的標籤,如//title,提取所有title標籤,包括title,若想剔除掉標籤,要用text(),即//title/text()

//標籤名[@屬性=『屬性值』] 提取屬性為xx的標籤

. 選取當前節點

.. 選取當前節點的父節點

@屬性名 代表取某個屬性值

通過python的lxml庫,利用xpath進行html的解析

1.安裝好lxml後

2.首先要匯入lxml中的etree模組,使用etree模組中的html方法構造解析物件(其實就是轉換為xpath可以識別的格式)

3.利用 解析物件.xpath 進行相應的匹配

**示例:

from lxml import etree

import urllib.request

data = urllib.request.urlopen("").read().decode("utf-8","ignore")

treedata = etree.html(data) #轉換格式,構造解析物件

title = treedata.xpath("//title/text()") #進行匹配,提取出來的內容不是列表

if(str(type(title)) == ""):

pass

else:

title = [i for i in title]

print(title[0])

如何在AndroidStudio中使用AIDL

本章節介紹如何在androidstudio中使用aidl 2.在aidl下建立乙個包,包裡建立乙個 aidl檔案,右鍵aidl new aidl aidl file 紅框就是建立完成後的樣子 3.在aidl檔案寫要被呼叫的方法,此方法不能有許可權修飾符 4.首先build下,然後建立乙個servic...

如何在Oracle中使用Sequence

sql server可以自增字段,但是oracle中在建表的時候可沒有這個選項,但是可以通過觸發器 trigger 或者序列 sequence 來實現,本文主要講述sequence。二者的區別oracle中自增字段的兩種方法的比較 trigger和sequence 建立sequence的語法很簡單,...

如何在Oracle中使用Sequence

sql server可以自增字段,但是oracle中在建表的時候可沒有這個選項,但是可以通過觸發器 trigger 或者序列 sequence 來實現,本文主要講述sequence。二者的區別oracle中自增字段的兩種方法的比較 trigger和sequence 在oracle中,沒有象ms sq...