正規表示式模式修正符

2021-06-09 05:19:05 字數 1848 閱讀 2299

php正規表示式 /i, /is, /s, /isu等 都是些什麼東西呢?

1、正規表示式運算順序

( ) 圓括號因為是記憶體處理所以最高

* ? + 重複匹配內容其次

^ $ \b 邊界處理第三

條件處理第四

最後按照運算順序計算匹配

2、正規表示式模式修正符

i 正則內容在匹配時候不區分大小寫(預設是區分的)

m 在匹配首內容或者尾內容時候採用多行識別匹配

s 將轉義回車取消是為單行匹配如. 匹配的時候

x 忽略正則中的空白

a 強制從頭開始匹配

d 強制$匹配尾部無任何內容 \n

u 禁止貪婪匹配只跟蹤到最近的乙個匹配符並結束,

常用在採集程式上的正規表示式

i 匹配大小寫

s 模式中的圓點元字元(.)匹配所有的字元,包括換行符

x 模式中的空白字元除了被轉義的或在字元類中的以外完全被忽略,在未轉義的字元類之外的 # 以及下乙個換行符之間的所有字元,包括兩頭,也都被忽略

a (pcre_anchored) 如果設定了此修正符,模式被強制為「anchored」,即強制僅從目標字串的開頭開始匹配即自動在模式開頭加上^。

d (pcre_dollar_endonly) 如果設定了此修正符,模式中的美元元字元僅匹配目標字串的結尾。沒有此選項時,如果最後乙個字元是換行符的話,美元符號也會匹配此字元之前(但不會匹配任何其它換行符之前)。如果設定了 m 修正符則忽略此選項。perl 中沒有與其等價的修正符。  s 當乙個模式將被使用若干次時,為加速匹配起見值得先對其進行分析。如果設定了此修正符則會進行額外的分析。目前,分析乙個模式僅對沒有單一固定起始字元的 non-anchored 模式有用。

u (pcre_ungreedy) 本修正符反轉了匹配數量的值使其不是預設的重複,而變成在後面跟上「?」才變得重複。這和 perl 不相容。也可以通過在模式之中設定 (?u) 修正符來啟用此選項。

x (pcre_extra) 此修正符啟用了乙個 pcre 中與 perl 不相容的額外功能。模式中的任何反斜線後面跟上乙個沒有特殊意義的字母導致乙個錯誤,從而保留此組合以備將 來擴充。預設情況下,和 perl 一樣,乙個反斜線後面跟乙個沒有特殊意義的字母被當成該字母本身。當前沒有其它特性受此修正符控制。即:貪婪模式,最 大限度匹配如:/a[\w]+?e/u匹配abceadeddd中的abceade而不是abce,如果不加u修正,則匹配abce  u (pcre_utf8) 此修正符啟用了乙個 pcre 中與 perl 不相容的額外功能。模式字串被當成 utf-8。本修正符在 unix 下自 php 4.1.0 起可用,在 win32 下自 php 4.2.3 起可用。

<?php

echo '';

$str = '';

$pattern = '~.*~';

preg_match($pattern,$str,$matches);

var_dump($matches);

$pattern1 = '~.*?~';

preg_match($pattern1,$str,$matches1);

var_dump($matches1);

$pattern2 = '~.*~u';

preg_match($pattern2,$str,$matches2);

var_dump($matches2);

$pattern3 = '~.*?~u';

preg_match($pattern3,$str,$matches3);

var_dump($matches3);

事實證明,加了u,原來是貪婪匹配的變成非貪婪匹配,非貪婪匹配的卻變成了貪婪匹配。

模式修正符 正規表示式

模式修正符是標記在整個正規表示式之外的,可以看著是對正規表示式的一些補充說明。常用的模式修正符如下 模式修正符說明i 模式中的字元將同時匹配大小寫字母 m字串視為多行 s將字串視為單行,換行符作為普通字元 x將模式中的空白忽略 epreg replace 函式在替換字串中對逆向引用作正常的替換,將其...

正規表示式模式修正符

下面列出了當前在 pcre 中可能使用的修正符。括號中是這些修正符的內部 pcre 名。修正符中的空格和換行被忽略,其它字元會導致錯誤。i pcre caseless 如果設定此修正符,模式中的字元將同時匹配大小寫字母。s pcre dotall 如果設定了此修正符,模式中的圓點元字元 匹配所有的字...

PHP正規表示式模式修正符

i pcre caseless 如果設定此修正符,模式中的字元將同時匹配大小寫字母。m pcre multiline 默 認情況下,pcre 將目標字串作為單一的一 行 字元所組成的 甚至其中包含有換行符也是如此 行起始 元字元 僅僅匹配字串的起始,行 結束 元字元 僅僅匹配字串的結束,或者最後乙個...