PHP之正規表示式捕獲組與非捕獲組(詳解)

2022-10-06 10:09:12 字數 2546 閱讀 6679

在專案開發過程中正則表示經常會用到,可以說會正規表示式是每個程式設計師最基本的要求,初學者在剛接觸正規表示式都感到很吃力。最近看到一位朋友的部落格寫的《php正規表示式》獲益頗多,在章節對萬用字元以及捕獲資料非常感興趣。這兩章節剛好也涉及到了正規表示式的捕獲組和非捕獲組的內容,以此來分析這方面的內容

我們知道,在正規表示式下(x) 表示匹配'x'並記錄匹配的值。這只是比較通俗的說法,甚至說這是不嚴謹的說法,只有()捕獲組形式才會記錄匹配的值。非捕獲組則只匹配,不記錄。

捕獲組:

(pattern)

這種形式是我們見到最多的一種形式,匹配並返回捕獲結果,可以巢狀,組號順序從左到右依次排列『。

複製** **如下:

$regex = '/(ab(c)+)+d(e)?/';   

$str = 'a程式設計客棧bccde';

$matches = array();

if(preg_match($regex, $str, $matches))

匹配結果:

複製** **如下:

array ( [0] => abccde [1] => abcc [2] => c [3] => e )

(?ppattern)

這種方式雖然看起來在構造正規表示式的時候略微複雜一點,但實質上與(pattern)一樣。最大的優勢體現在對結果處理上,程式設計師可以直接根據自己設定的直接快速呼叫結果,而不用再去數需要的結果在第幾個子組了。

複製** **如下:

$regex = '/(?p\w(?p\w))abc(?p\w)45/';

$str = 'fsabcd程式設計客棧45';

$matches = array();

if(preg_match($regex, $str, $matches))

匹配結果:

複製** **如下:

array ( [0] => fsabcd45 [group1] => fs [1] => fs [group2] => s [2] => s [group3] => d程式設計客棧 [3] => d )

\num

num是乙個整數,是對捕獲組的反向引用。  例如\2表示第二個子組匹配值,\表示第乙個子組匹配值

複製** **如下:

$regex = '/(\w)(\w)\2\1/';   

$str = 'abba';

$matches = array();

if(preg_match($regex, $str, $matches))

匹配結果:

複製** **如下:

array ( [0] => abba [1] => a [2] => b )

注意,這裡我疏忽了乙個小細節,一開始我第一樣**是$regex = 「/(\w)(\w)\2\1/」;結果返回無匹配結果,經過除錯後,發現這裡只能用' '。'與" 用法差別大家還是需要注意下。

\k< name >

了解了(?ppattern)與\num,這個就不難理解了。\k< name >是對命名捕獲組的反向引用。其中 name 是捕獲組名。

複製** **如下:

$regex='/(?p\w)abc\k/';

$str="fabcf";

echo preg_match_all($regex, $str,$matches);

print_r($matches);

匹配結果:

複製** **如下:

array ( [0] => array ( [0] => fabcf ) [nametbqnmg] => array ( [0] => f ) [1] => array ( [0] => f ) )

非捕獲組:

(?:pattern)

與(pattern)的唯一區別是,匹配pattern但不捕獲匹配結果。這裡便不再舉例。

還有四種方式實際上講的是乙個事情:預查。

預查分為正向預查與反向預查。根據字面理解,正向預查是判斷匹配字串後面某些字元存在與否,而反向預查則是判斷匹配字串前面某些字元存在與否。

正向預查判斷存在使用(?=pattern),判斷不存在使用(?!pattern)。

反向預查判斷存在使用(?<=pattern),判斷不存在使用(?

複製** **如下:

$regx='/(?<=a)bc(?=d)/';

$str="abcd ebcd abce ebca";

if(preg_match_all($regx, $str, $matches))

匹配結果:

複製** **如下:

array ( [0] => array ( [0] => bc) )

這四種形式使用的是否只要注意好相對匹配字串的位置和斷言肯定還是否定,就會很快掌握。

另外,預查的四種形式是零寬度的,匹配的時候只做乙個判斷,本身是不佔位置的。/he(?=l)llo/ 與hello匹配,而/he(?=l)lo/與hello是不匹配的。畢竟但從位元組數上兩者就是不匹配的,前者只有4個,而後者有5個。

以上就是php之正規表示式捕獲組與非捕獲組詳解的全部內容,希望對大家有所啟迪。

本文標題: php之正規表示式捕獲組與非捕獲組(詳解)

本文位址:

正規表示式之捕獲組 非捕獲組

語法 字元 描述 示例 pattern 匹配pattern並捕獲結果,自動設定組號。abc d 匹配abcd或者abcabcd pattern 或 name pattern 匹配pattern並捕獲結果,設定name為組名。num 對捕獲組的反向引用。其中 num 是乙個正整數。w w 2 1 匹配...

正規表示式之捕獲組 非捕獲組介紹

捕獲組 語法 字元 描述 示例 pattern 匹配pattern並捕獲結果,自動設定組號。abc d 匹配abcd或者abcabcd pattern 或 name pattern 匹配pattern並捕獲結果,設定name為組名。num 對捕獲組的反向引用。其中 num 是乙個正整數。w w 2 ...

正規表示式 (捕獲組與group)

先來看個例子 把逗號之間的數字和逗號括號分隔的數字取出來 string s this data singlev300 bindec substr this databin,5960,81 pattern ss1 pattern.compile 0 9 matcher m1 ss1.matcher s...