正規表示式匹配html標籤

2021-10-17 11:01:32 字數 1067 閱讀 9668

1、匹配:

import re

str=

""result = re.match(r"<\w*>.*"

,str

)print

(result)

執行結果:

說明:html中的<>和/匹配時仍舊使用<>和/

\w可以匹配數字、字母、下劃線、希臘字母、俄文本母等

*表示至少有0個

.匹配任意單字元,除了換行符\n

上述匹配有乙個缺陷,"

result = re.match(r"<(\w*)>.*"

,str

)print

(result)

'''()表示組的意思

(\w*)表示有內容的乙個組

\1表示第一組,和前面的\w*是一樣的同一組

'''

2、匹配:

import re

str=""

result = re.match(r"<(\w*)><(\w*)>.*"

,str

)print

(result)

執行結果:

'>

說明:找到組的一一對應關係,從左往右數,組數從1開始然後按組別進行匹配

匹配案例2還有另外一種寫法:

import re

str=""

result = re.match(r"<(?p\w*)><(?p\w*)>.*"

,str

)print

(result)

'''?p表示給組設定變數名,將其定義在組內。<>裡的名字隨意,如name1,name2都可以

(?p=n1) 表示使用變數,只不過把組當作乙個變數,然後在使用這個變數

'''

正規表示式匹配html標籤table

首先,要匹配任意內容 是不行的,因為不匹配 n 取不到想要的內容,所以有了如下表示式 s s 當然,你也可以用 d d w w 來表示。現在我們來匹配乙個html標籤,匹配table如下 s s table 或 s s table 以上兩個表示式,乙個加了 和乙個卻不加 那麼這有什麼區別呢?我們知道...

使用正規表示式匹配巢狀Html標籤

概述 正規表示式是做文字解析工作必不可少的技能。如web伺服器日誌分析,網頁前端開發等。很多高階文字編輯器都支援正規表示式的乙個子集,熟練掌握正規表示式,經常能夠使你的一些工作事半功倍。例如統計 行數,只需乙個正則就搞定。巢狀html標籤的匹配是正規表示式應用中乙個比較難的話題,因為它涉及到的正則語...

使用正規表示式匹配巢狀Html標籤

正規表示式是做文字解析工作必不可少的技能。如web伺服器日誌分析,網頁前端開發等。很多高階文字編輯器都支援正規表示式的乙個子集,熟練掌握正規表示式,經常能夠使你的一些工作事半功倍。例如統計 行數,只需乙個正則就搞定。巢狀html標籤的匹配是正規表示式應用中乙個比較難的話題,因為它涉及到的正則語法比較...