PHP正則貪婪 懶惰匹配模式

2021-07-22 16:00:39 字數 1072 閱讀 7393

當正規表示式中包含能接受重複的限定符時,通常的行為是(在使整個表示式能得到匹配的前提下)匹配盡可能多的字元。例如以下表示式將匹配以a開始,以b結束的最長字串:

a.*b

如果用來搜尋「aabab」,它會匹配整個字串「aabab」。這就是貪婪匹配。

有時,需要匹配盡可能少的字元,也就是懶惰匹配。前面給出的限定符都可以轉化為懶惰匹配模式,只要在後面加上乙個問號。例如「.*?」就意味著匹配任意數量的重複,但是在能使整個匹配成功的前提下使用最少的重複。例如,匹配以a開始、以b結束的最短字串,正規表示式如下:

a.*?b

把上述表示式應用於aabab,如果只考慮「.*?」這個表示式,最先會匹配到aab(1~3字元)和ab(第2~3個字元)這兩組字元。

為什麼第乙個匹配是aab(第1~3個字元)而不是ab(第2~3個字元)?簡單地說,正規表示式有另一條規則,比懶惰/貪婪規則的優先順序更高:最先開始的匹配擁有最高優先權。

常用懶惰限定符如下:

懶惰模式匹配原理簡單來說,是在匹配和不匹配都可以的情況下,優先不匹配,記錄備選狀態,並將匹配控制交給正規表示式的下乙個匹配字元。當後面的匹配失敗時,回溯,進行匹配。關於回溯以及正規表示式效率等高階內容,可以查閱《精通正規表示式》一書。

在3.3.6節涉及懶惰匹配,把該節的例子稍作更改:

<?php

$str='[url]1.gif[/url][url]2.gif[/url][url]3.gif[/url]';

$s=preg_replace("#\[url\](.*)\[\/url\]#","

var_dump($s);

在貪婪模式下,由於匹配表示式是「.*」,即任意字元出現任意次,這個正規表示式會一直匹配[url]後的內容,直到遇到結束條件「[\/」。匹配結果如下:

提示 實際開發中,涉及貪婪模式與懶惰模式的地方是很多的。在一定情況下,使用懶惰模式可以減少回溯,提高效率。

php正則 貪婪模式與懶惰模式

當正規表示式中包含能接受重複的限定符時,通常的行為是 在使整個表示式能得到匹配的前提下 匹配盡可能多的字元。考慮這個表示式 a.b,它將會匹配最長的以a開始,以b結束的字串。如果用它來搜尋aabab的話,它會匹配整個字串aabab。這被稱為貪婪匹配。有時,我們更需要懶惰匹配,也就是匹配盡可能少的字元...

php正則 貪婪模式與懶惰模式

當正規表示式中包含能接受重複的限定符時,通常的行為是 在使整個表示式能得到匹配的前提下 匹配盡可能多的字元。考慮這個表示式 a.b 它將會匹配最長的以a開始,以b結束的字串。如果用它來搜尋aabab 的話,它會匹配整個字串aabab。這被稱為貪婪匹配。有時,我們更需要懶惰匹配,也就是匹配盡可能少的字...

正則中的「貪婪匹配」和「懶惰匹配」

進行正則匹配時,像 以及 m,n 這幾種量詞 匹配數量 預設是屬於貪婪量詞,會進行貪婪匹配。什麼叫做貪婪匹配呢?貪婪就是盡可能的多匹配,貪心的意思。比如現在目標字串是 aaaa 四個a組成的字串 a 和 a 都會匹配 aaaa a?則會匹配 a 這就是貪婪匹配,實際運用中,有的時候我們卻希望盡可能少...