XPath特殊應用

2021-08-19 07:06:32 字數 804 閱讀 4841

#encoding=utf-8

from lxml import etree

html1 = '''

需要內容1

需要內容2

需要內容3

'''html2 = '''

我左青龍,

右白虎,

老牛在當中,

龍頭在胸口.

'''# # starts-with(@屬性名稱,屬性字元相同的部分)

# selector = etree.html(html1)

# content = selector.xpath('//div[starts-with(@id,"test")]/text()')

# for each in content:

# print each

#標籤套標籤情況(不可以提取其他標籤裡面的內容貼)

# selector = etree.html(html2)

# content_1 = selector.xpath('//div[@id="test3"]/text()')

# for each in content_1:

# print each

# #標籤套標籤情況

# data = selector.xpath('//div[@id="test3"]')[0]

# info = data.xpath('string(.)')

# content_2 = info.replace('\n','').replace(' ','')

# print content_2

xpath 具體應用

coding utf 8 import sys import requests from lxml import etree import codecs reload sys sys.setdefaultencoding utf 8 3.html 存本地使加快請求速度 open 後為路徑 建議用相對...

scrapy應用xpath語法

如 等等各種型別xpath語法可以用分號做分隔符來區分標籤 但是最需要注意的是標籤的屬性值和標籤下的內容 以及這個部分 下面將對這兩個部分書寫xpath div a text get 首先鎖定要查詢的父標籤 text response.xpath div id search nature rg ul...

XML中XPath的應用

xpath即為xml路徑語言,它是一種用來確定xml 標準通用標記語言的子集 文件中某部分位置的語言。xpath基於xml的樹狀結構,提供在資料結構樹中找尋節點的能力。起初 xpath 的提出的初衷是將其作為乙個通用的 介於xpointer與xslt間的語法模型。但是 xpath 很快的被開發者採用...