正規表示式

2021-08-10 04:11:10 字數 2110 閱讀 1460

在編寫處理字串的程式或網頁時,經常有查詢符合某些複雜規則的字串的需要。正規表示式就是用於描述這些規則的工具。換句話說,

正規表示式就是記錄文字規則的**。

正規表示式的() {}有不同的意思。

() 是為了提取匹配的字串。表示式中有幾個()就有幾個相應的匹配字串。

(\s*)表示連續空格的字串。

是定義匹配的字元範圍。比如 [a-za-z0-9] 表示相應位置的字元要匹配英文本元和數字。[\s*]表示空格或者*號。

{}一般用來表示匹配的長度,比如 \s 表示匹配三個空格,\s[1,3]表示匹配一到三個空格。

(0-9) 匹配 '0-9′ 本身。 [0-9]* 匹配數字(注意後面有 *,可以為空)[0-9]+ 匹配數字(注意後面有 +,不可以為空) 寫法錯誤。

[0-9] 表示長度為 0 到 9 的數字字串。

x|y匹配 x 或 y。例如,'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 則匹配 "zood" 或 "food"。

[xyz]

字元集合。匹配所包含的任意乙個字元。例如, '[abc]' 可以匹配 "plain" 中的 'a'。

[^xyz]

負值字元集合。匹配未包含的任意字元。例如, '[^abc]' 可以匹配 "plain" 中的'p'、'l'、'i'、'n'。

[a-z]

字元範圍。匹配指定範圍內的任意字元。例如,'[a-z]' 可以匹配 'a' 到 'z' 範圍內的任意小寫字母字元。

[^a-z]

負值字元範圍。匹配任何不在指定範圍內的任意字元。例如,'[^a-z]' 可以匹配任何不在 'a' 到 'z' 範圍內的任意字元。

\d匹配乙個數字字元。等價於 [0-9]。

\d匹配乙個非數字字元。等價於 [^0-9]。

\f匹配乙個換頁符。等價於 \x0c 和 \cl。

\n匹配乙個換行符。等價於 \x0a 和 \cj。

\r匹配乙個回車符。等價於 \x0d 和 \cm。

\s匹配任何空白字元,包括空格、製表符、換頁符等等。等價於 [ \f\n\r\t\v]。

\s匹配任何非空白字元。等價於 [^ \f\n\r\t\v]。

\t匹配乙個製表符。等價於 \x09 和 \ci。

在internet的程式中,正規表示式通常用來驗證使用者的輸入。當使用者提交乙個form以後,要判斷輸入的**號碼、位址、email位址、信用卡號碼等是否有效,用普通的基於字面的字元是不夠的。

所以要用一種更自由的描述我們要的模式的辦法,它就是字元簇。要建立乙個表示所有母音字元的字元簇,就把所有的母音字元放在乙個方括號裡:

[

aaeeiioouu

]

這個模式與任何母音字元匹配,但只能表示乙個字元。用連字型大小可以表示乙個字元的範圍,如:

[a-

z]//匹配所有的小寫字母 [a

-z]//匹配所有的大寫字母 [a

-za-z

]//匹配所有的字母 [0

-9]//匹配所有的數字 [0

-9\.\-

]//匹配所有的數字,句號和減號

[\f\r\t\n

]//匹配所有的白字元

同樣的,這些也只表示乙個字元,這是乙個非常重要的。如果要匹配乙個由乙個小寫字母和一位數字組成的字串,比如"z2"、"t6"或"g7",但不是"ab2"、"r2d3" 或"b52"的話,用這個模式:

^[a-

z][0-

9]$

儘管[a-z]代表26個字母的範圍,但在這裡它只能與第乙個字元是小寫字母的字串匹配。

前面曾經提到^表示字串的開頭,但它還有另外乙個含義。當在一組方括號裡使用^是,它表示"非"或"排除"的意思,常常用來剔除某個字元。還用前面的例子,我們要求第乙個字元不能是數字:

^[^0-

9][0-

9]$

這個模式與"&5"、"g7"及"-2"是匹配的,但與"12"、"66"是不匹配的。下面是幾個排除特定字元的例子:

[^a-

z]//除了小寫字母以外的所有字元

[^\\\/\^

]//除了(\)(/)(^)之外的所有字元

[^\"\'

]//除了雙引號(")和單引號(')之外的所有字元

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...