正規表示式

2021-08-07 19:34:08 字數 4752 閱讀 4183

正規表示式

1.什麼叫正規表示式

正規表示式是對字串進行操作的一種邏輯公式,就是用一些特定的字元組合成乙個規則字串,稱之為正則匹配模式。

if (preg_match($p, $str))

php中使用pcre庫函式進行正則匹配,,比如上例中的preg_match用於執行乙個正則匹配,常用來判斷一類字元模式是否存在。

2.正規表示式的基本語法

pcre庫函式中,正則匹配模式使用分隔符與元字元組成,分隔符可以是非數字、非反斜線、非空格的任意字元。經常使用的分隔符是正斜線(/)、hash符號(#)以及反符號(~),例如:

/foo bar/

#^[^0-9]$#

~php~

如果模式中包含分隔符,則分隔符需要需要反斜槓(\)進行轉義。

如果模式中包含較多的分割字元,建議更換其他的字元作為分隔符,也可以使用pre_quote進行轉義。

分隔符後面可以使用模式修飾符,模式修飾符包括:i,m,s,x等,例如使用i修飾符可以忽略大小寫匹配。

3.元字元與轉義

正規表示式中具有特殊含義的字元稱之為元字元,常用的元字元有:

\  一般用於轉義字元

^  斷言目標的開始位置(或在多行模式下是行首)

$  斷言目標的結束位置(或在多行模式下是行尾)

.  匹配除換行符外的任何字元(預設)

[  開始字元類定義

]  結束字元類定義

|  開始乙個可選分支

(  子組的開始標記

)  子組的結束標記

?  作為量詞,表示0次或1次匹配。位於量詞後面來改變量詞的貪婪特性

*  量詞,0次或多次匹配

+  量詞,1次或多次匹配

自定義量詞結束標記

//下面的\s匹配任意的空白符,包括空格,製表符,換行符。[^\s]代表非空白符。[^\s]+表示一次或多次匹配非空白符。

$p = '/^我[^\s]+(蘋果|香蕉)$/';

$str = "我喜歡吃蘋果";

if (preg_match($p, $str))

元字元具有兩種使用場景,一種是可以在任何地方都能使用,另一種是只能在方括號內使用,在方括號內使用的有:

\  轉義字元

^  僅在作為第乙個字元(方括號)時,表明字元類取反

-  標記字元範圍

其中^在反括號外面,表示斷言目標的開始位置,但在方括號內部則表示字元類取反,方括號內的減號-k可以標記字元範圍,例如0-9表示0到9之間的所有數字。

//下面的\w匹配字母或數字或下劃線。

$p = '/[\w\.\-]+@[a-z0-9\-]+\.(com|cn)/';

$str = "我的郵箱是[email protected]";

preg_match($p, $str, $match);

echo $match[0];

4.貪婪模式與懶惰模式

正規表示式中每個元字元匹配乙個字元,當使用+之後將會變得貪婪,它將匹配盡可能多的字元,當使用問號?字元時,它將盡可能少的匹配字元,即是懶惰模式。

貪婪模式:在可匹配與可不匹配的時候,優先匹配

//下面的\d表示匹配數字

$p = '/\d+\-\d+/';$str = "我的**是010-12345678";preg_match($p, $str, $match);echo $match[0]; //結果為:010-12345678

懶惰模式:在可匹配與可不匹配的時候,優先不匹配

$p = '/\d?\-\d?/';

$str = "我的**是010-12345678";

preg_match($p, $str, $match);

echo $match[0];  //結果為:0-1

當我們確切的知道所匹配的字元長度的時候,可以使用{}指定匹配字元數

$p = '/\d\-\d/';

$str = "我的**是010-12345678";

preg_match($p, $str, $match);

echo $match[0]; //結果為:010-12345678

(\w匹配字母或數字或下劃線,\s匹配任意的空白符,包括空格、製表符、換行符)

5.使用正規表示式進行匹配

使用正規表示式的目的是為了實現比字串處理函式更加靈活的處理方式,因此跟字串處理函式一樣,其主要用來子字串是否存在、字串替換、分割字串、獲取模式字串等。

php使用pcre庫函式來進行正則處理,通過設定好模式,然後呼叫相關的處理函式來取得匹配結果。

preg_match用來執行乙個匹配,可以簡單的用來判斷模式是否匹配成功,或者取得乙個匹配結果,它的返回值是匹配成功的次數0或1,在匹配到1次後就會停止搜尋。

$subject = "abcdef";

$pattern = '/def/';

preg_match($pattern, $subject, $matches);

print_r($matches); //結果為:array ( [0] => def )

上面的**簡單的執行了乙個匹配,簡單的判斷def是否能匹配成功,但是正規表示式的強大的地方是進行模式匹配,因此更多的時候,會使用模式:

$subject = "abcdef";

$pattern = '/a(.*?)d/';

preg_match($pattern, $subject, $matches);

print_r($matches); //結果為:array ( [0] => abcd [1] => bc )

通過正規表示式可以匹配乙個模式,得到更多的有用的資料。

6.查詢所有匹配結果

preg_match只能匹配一次結果,但很多時候我們需要匹配所有的結果,preg_match_all可以迴圈獲取乙個列表的匹配結果陣列。

$p = "|<[^>]+>(.*?)]+>|i";

$str = "example:this is a test";

preg_match_all($p, $str, $matches);

print_r($matches);

可以使用preg_match_all匹配乙個**中的資料:

$p = "/(.*?)<\/td>\s*(.*?)<\/td>\s*<\/tr>/i";

$str = "eric

25 john

26 ";

preg_match_all($p, $str, $matches);

print_r($matches);

$matches結果排序為$matches[0]儲存完整模式的所有匹配,$matches[1]儲存第乙個子組的所有匹配,以此類推。

7.正規表示式的搜尋和替換

正規表示式的搜尋與替換在某些方面具有重要用途,比如調整目標字串的格式,改變目標字串中匹配字串的順序等。

例如我們可以簡單的調整字串的日期格式:

$string = 'april 15, 2014';

$pattern = '/(\w+) (\d+), (\d+)/i';

$replacement = '$3, $ $2';

echo preg_replace($pattern, $replacement, $string); //結果為:2014, april 15

其中$與$1的寫法是等效的,表示第乙個匹配的字串,$2代表第二個匹配的。

用正則替換來去掉多餘的空格與字元

$str = 'one     two';

$str = preg_replace('/\s+/', ' ', $str);

echo $str; // 結果改變為'one two'

8.正則匹配常用案列

正則匹配常用在表單驗證上,一些欄位會有一定的格式要求,比如使用者名稱一般都要求必須是字母、數字或下劃線組成,郵箱、**等也都有自己的規則,因此使用正規表示式可以很好的對這些字段進行驗證。

我們來通過案例來看一下一般的使用者註冊頁,都怎麼樣對欄位進行驗證。

<?php

$user = array(

'name' => 'spark1985',

'email' => '[email protected]',

'mobile' => '13312345678'

);//進行一般性驗證

if (empty($user))

if (strlen($user['name']) < 6)

//使用者名稱必須為字母、數字與下劃線

if (!preg_match('/^\w+$/i', $user['name']))

//驗證郵箱格式是否正確

if (!preg_match('/^[\w\.]+@\w+\.\w+$/i', $user['email']))

//手機號必須為11位數字,且為1開頭

if (!preg_match('/^1\d$/i', $user['mobile']))

echo '使用者資訊驗證成功';

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...