正規表示式

2021-07-12 04:54:35 字數 1062 閱讀 6079

1、正規表示式中包括的元素

(1)、原子(普通字元:a-z a-z 0-9 、原子表、 轉義字元)

(2)、元字元 (有特殊功能的字元)

(3)、模式修正符 (系統內建部分字元 i 、m、s、u…)

2、正規表示式中的「原子」

①a-z a-z _ 0-9 //最常見的字元

②(abc) (skd) //用圓括號包含起來的單元符合

③[abcs] [^abd] //用方括號包含的原子表,原子表中的^代表排除或相反內容

④轉義字元

\d 包含所有數字[0-9]

\d 除所有數字外[^0-9]

\w 包含所有英文本元[a-za-z_0-9]

\w 除所有英文本元外[^a-za-z_0-9]

\s 包含空白區域如回車、換行、分頁等 [\f\n\r]

3、正規表示式元字元

* 匹配前乙個內容的0次1次或多次

. 匹配內容的0次1次或多次,但不包含回車換行

+ 匹配前乙個內容的1次或多次

?匹配前乙個內容的0次或1次

| 選擇匹配類似php中的| (因為這個運算符合是弱型別導致前面最為整體匹配)

^ 匹配字串首部內容

$ 匹配字串尾部內容

\b 匹配單詞邊界,邊界可以是空格或者特殊符合

\b 匹配除帶單詞邊界意外內容

匹配前乙個內容的重複次數為m次

匹配前乙個內容的重複次數大於等於m次

匹配前乙個內容的重複次數m次到n次

( ) 合併整體匹配,並放入記憶體,可使用\1 \2…依次獲取

4、模式修正符

模式修正符是為正規表示式增強和補充的乙個功能,使用在正則之外

常用修正符

i 正則內容在匹配時候不區分大小寫(預設是區分的)

m 在匹配首內容或者尾內容時候採用多行識別匹配

s 將轉義回車取消是為單行匹配如. 匹配的時候

x 忽略正則中的空白

a 強制從頭開始匹配

d 強制$匹配尾部無任何內容 \n

u 禁止貪婪匹配 只跟蹤到最近的乙個匹配符並結束,常用在採集程式上的正規表示式

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...