python 根據標籤名獲取標籤內容

2021-09-04 11:49:01 字數 1479 閱讀 8880

import re

import json

import requests

from bs4 import beautifulsoup

import lxml.html

from lxml import etree

result = requests.get('')

with open('123.html', 'wb') as f:

f.write(result.content)

# print(parse_regex(result.text))

test_data = """

harry potter

29.99

learning xml

39.95

python

40

"""# //div/ul/li/a[@id] 選取a標籤中帶有id屬性的標籤

# //div/ul/li/a 選取所有a標籤

# //div/ul/li[2]/a

"""/ 從根標籤開始 必須具有嚴格的父子關係

// 從當前標籤 後續節點含有即可選出

* 萬用字元 選擇所有

//div/book[1]/title 選擇div下第乙個book標籤的title標籤

//div/book[1]/tittle[@lang="zh"] 選擇div下第乙個book標籤的title標籤並且內容是zh的title標籤

//div/book/title //book/title //title 具有相同結果 只不過選取路徑不一樣

//book/title/@* 將title所有的屬性值選出來

//book/title/text() 將title的內容選擇出來,使用內建函式

//a[@href="link1.html" and @id="places_neighbours_row"]

//div/book/[last()]/title/text() 將最後乙個book元素選出

//div/book[price > 39]/title/text() 將book子標籤price數值大於39的選擇出來

//li[starts-with(@class,'item')] 將class屬性字首是item的選出來

//title[contains(@lang,"eng")]將title屬性lang含有eng關鍵字的標籤選出

"""html = lxml.html.fromstring(test_data) # 載入任意乙個字串

html_data = html.xpath('//title[contains(@lang,"eng")]') # xpath 查詢路徑

# print(dir(html_data[0])) # 檢視html_data有什麼功能

print(html_data)

for i in html_data:

print(i.text)

js獲取元素的標籤名

有時候我們想獲取到乙個標籤的名稱,例如 a 得到 div 請看下面的例子 頁面上有乙個class a 的標籤,可能是input,也可能是普通的div或者是span標籤,現在我們要往這個標籤加乙個值 value1 如果是input則將其value屬性設定為value1,div則將其innerhtml設...

根據標籤名稱,查詢xml檔案內的標籤資料

include main.h include include 找出所有的標籤名稱,並存到乙個陣列中,並把標籤尾的位置,儲存到這個標籤名稱之後 int gettitlelist char pszxmldata,int nxmldatalen,char psztitledata,int pntitlel...

gitlab api根據標籤或者分支獲取目錄和檔案

官網gitlab api相關url 根據標籤或者分支獲取目錄和檔案 引數解析 project gitlab上的專案,可以通過gitlaapi.getproject 獲得 path 要查詢的檔案路徑,為空則表示查詢根目錄 ref name 標籤或者分支名 recursive 是否遞迴查詢所有目錄和檔案...