正規表示式基礎用法

2022-08-04 23:09:20 字數 2248 閱讀 7658

參考文件  正規表示式必知必會  ben forta著 楊濤譯

一、  正規表示式用途  搜尋和替換   正規表示式是用來匹配和處理文字的字串

二、 元字元分為兩種,  一種匹配文字的(例如.  *), 一種是正規表示式語法所要求的(例如)。這些元字元要匹配自己本事需要轉義"\"

空白元字元

「貪婪型」元字元,進行匹配時是」多多益善而不是適可而止」

」懶惰型」元字元,進行匹配時是「匹配盡可能少的字元」

五、位置匹配

\bcat\b   \b用來匹配完整的單詞,\b只匹配乙個位置,單詞邊界,不匹配任何字元

\b          不匹配單詞邊界

子表示式

子表示式的作用是把同乙個表示式的各個相關部分組合在一起,對重複次數元字元的作用物件作出京珠的設定和控制、對"|"操作的or條件作出準確的定義

子表示式將多個元素作為乙個元素處理,用(),例如(abc)指必須匹配abc的字串,abc作為獨立元素,相當於乙個元素

子表示式中的或用"|",例如(19|20) 指的是19或20

子表示式回溯引用

小結:使用元字元

[\w.]+@[\w.]+\.\w    匹配合法電子郵箱位址  

[1-9][\d][\-]\d[\-]\d

匹配ip位址

(([1-9]|[1-9][0-9]|1\d|2[0-4][0-9]|25[0-5])\.)([1-9]|[1-9][0-9]|1\d|2[0-4][0-9]|25[0-5])

一位數字非0

兩位數字,第一位不是零

1開頭的任意三位數字

2開頭的,第二位在0-4之前的任意三位數字

25開頭的,第三位在0-5之間的三位數字

匹配重複次數

+  匹配前面的字元或字元集合一次或多次  

*  匹配前面的字元或字符集和集合零次或多次   

?  匹配前面的字元或字元集合零次或一次

匹配前面的字元或字元集合具體次數

匹配前面的字元或字元集合至少多少次

匹配前面的字元或字元集合最多多少次

在字元集合中[.+] 不需要轉義,預設是普通字元

位置匹配

\bcat\b   \b用來匹配完整的單詞,\b只匹配乙個位置,單詞邊界,不匹配任何字元

\b          不匹配單詞邊界

^   只在中,緊跟[後面時,是非的意思,在字元集合外面,並位於乙個模式的開頭,^將匹配字串的開頭

$   匹配字串或字元集合的結尾

子表示式

(),例如(19|20|21)\d   指的是以19、20、21開頭的四位數字

表示式的回溯引用  前後一致引用

+(\w+)+\1   \1代表第乙個子表示式()  \2代表第二個子表示式  我們可以把回溯引用理解為變數  \0 代表整個正規表示式

正則中 、() 、{}區別

指匹配其中乙個即可,例如[abc],只要匹配abc中的乙個字母就可以

() 將()中的表示式看做乙個元素,例如(abc)指匹配到abc的字串

{} 指的是前面表示式匹配的次數

正規表示式基礎用法

正規表示式 regular expression 描述了一種字串匹配的模式 pattern 可以用來檢查乙個串是否含有某種子串 將匹配的子串替換或者從某個串中取出符合某個條件的子串等。字元含義示例 匹配任意長度的字串 匹配長度為1的字串 匹配除換行符以外的任意字元 匹配字串 一行 的開始 匹配字串 ...

正規表示式基礎用法總結

正規表示式概述 專門描述字串中字元出現規則的表示式 1 用途 1 驗證字串格式 2 查詢 遮蔽敏感詞 2 字符集 3 預定義字符集 字符集的最簡化寫法 d 一位數字 0 9 w 匹配一位字母 數字或 s 可匹配空格 製表符tab等空白 匹配所有文字 萬用字元 4 數量詞 如果規定乙個字符集或子規則反...

正規表示式基礎用法總結

匹配除換行符以外的任意字元 w 匹配字母或數字或下劃線或漢字 s 匹配任意的空白符 d 匹配數字 b 匹配單詞的開始或結束 一般用於校驗整個字串 匹配字串的開始 整個字串最開頭 匹配字串的結束 整個字串最後 如果你想查詢元字元本身的話,比如你查詢.或者 就出現了問題 你沒辦法指定它們,因為它們會被解...