正規表示式分組零寬斷言

import re
a ='123.123.123.aaa.aaa.aaa'
reg =
'(\d)(.\\1).(\w)(.\\3)'
res = re.search(reg,a)
print
(res)
#

引用分組上例中\\1代表引用第乙個分組\d；\\3代表引用第三個分組\w

import re
a ='123.234.345.456'
b ='123.123.123.123'
reg =
'(\d)(.\\1)'
resa = re.search(reg,a)
resb = re.search(reg,b)
print
(resa,
'\n'
,resb)
'''輸出
none 
'''

引用文字內容由上例，後向引用，引用的僅僅是文字內容，而不是正規表示式也就是說，組中的內容一旦匹配成功，後向引用，引用的就是匹配成功後的內容，引用的是結果，而不是表示式。

分組編號規律

無論括號如何巢狀，分組的編號都是根據開括號出現的順序來計數的；開括號是從左至右數起第多少個開括號，分組編號就是多少。如下圖：

指明某個字串前邊或者後邊，將會出現滿足某種規律的字串

如：(?<=).*(?=) 或者 (?<=).*(?=)

a =
'這裡是標題內容'
reg =
'(?<=).*(?=)'
# 或# reg = '(?<=).*(?=)'
resa = re.search(reg,a)
print
(resa)
#

例：匹配中國人的「人」而不匹配外國人的「人」

b =
'外國人中國人'
reg1 =
'(?reg2 =
'人'res1 = re.search(reg1,b)
res2 = re.search(reg2,b)
print
(res1,
'\n'
,res2)
'''輸出
'''

例：匹配中國製造的「中國」

b =
'中國生產中國製造'
reg1 =
'中國(?!生產)'
res1 = re.search(reg1,b)
print
(res1)
'''輸出
'''

如同^代表開頭，$代表結尾，\b代表單詞邊界一樣，先行斷言和後行斷言也有類似的作用，它們只匹配某些位置，在匹配過程中，不占用字元，所以被稱為「零寬」。所謂位置，是指字串中(每行)第乙個字元的左邊、最後乙個字元的右邊以及相鄰字元的中間（假設文字方向是頭左尾右）

理解

關於先行(lookahead)和後行(lookbehind)

正規表示式引擎在執行字串和表示式匹配時，會從頭到尾（從前到後）連續掃瞄字串中的字元，設想有乙個掃瞄指標指向字元邊界處並隨匹配過程移動。先行斷言，是當掃瞄指標位於某處時，引擎會嘗試匹配指標還未掃過的字元，先於指標到達該字元，故稱為先行。後行斷言，引擎會嘗試匹配指標已掃過的字元，後於指標到達該字元，故稱為後行。

關於正向(positive)和負向(negative)

正向就表示匹配括號中的表示式，負向表示不匹配。

正規表示式分組零寬斷言

正規表示式零寬斷言

正規表示式零寬斷言

正規表示式零寬斷言

正規表示式 分組 零寬斷言

正規表示式 零寬斷言

正規表示式 零寬斷言

正規表示式 零寬斷言

相關推薦

正規表示式分組零寬斷言

正規表示式零寬斷言

正規表示式零寬斷言

正規表示式零寬斷言