正規表示式語法和常用表示式列表

2021-10-11 20:50:48 字數 2023 閱讀 6942

為什麼需要正規表示式?

文字的複雜處理。

正規表示式的優勢和用途?

正規表示式定義·

開發中使用正規表示式的流程:

分折所要匹配的資料,寫出測試用的典型資料

在工具軟體中進行匹配測試

在程式中呼叫通過測試的正規表示式

正規表示式語法

1.普通字元

字母、數字、漢字、下劃線、以及沒有特殊定義的標點符號,都是「普通字元"。表示式中的普通字元,在匹配乙個字串的時候,匹配與之相同的乙個字元

2.簡單的轉義字元

特殊欄位都是由各自的用處,不能直接使用特殊字元,需要經過轉義之後,才能進行使用,**中後兩行中的都需要加「/」,轉義之後才能表示自身字元。

3.標準字元集合

4.自定義字元集合

方括號匹配方式,能夠匹配方括號中任意乙個字元

5.量詞(quantifier)

修飾匹配次數的特殊符號

6.字元邊界

(本組標記匹配的不是字元而是位置,符合某種條件的位置)

正規表示式的匹配模式1.ignorecase忽略大小寫模式

匹配時忽略大小寫。

預設情況下,正規表示式是要區分大小寫的。

2.singleline單行模式

整個文字看作乙個字串,只有乙個開頭,乙個結尾。

使小數點"."可以匹配包含換行符(\n)在內的任意字元。

3.multiline多行模式

每行都是乙個字串,都有開頭和結尾。

在指定了multiline之後,如果需要僅匹配字串開始和結束位置,可以使用\a和\z

7.選擇符和分組

8.反向引用(\nnn)

9.預搜尋(零寬斷言)

常見的正規表示式列表:

匹配中文字元          

[\u4e00-\u9fa5]

匹配空白行    

\n\s*\r (可以用來刪除空白行)

匹配html標記        

]*>.*?|<.> 

匹配首尾空白字元

^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等),非常有用的表示式)

匹配email位址

^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

匹配**url

[a-za-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

匹配國內**號碼

(0511-4405222、021-87888822):\d-\d|\d-\d

[1-9][0-9]

匹配身份證

\d|\d

匹配ip位址

\d+\.\d+\.\d+\.\d+ (提取ip位址時有用)

更多正規表示式語法可以參考:  最全的常用正規表示式大全——包括校驗數字、字元、一些特殊的需求等等

正規表示式簡單語法及常用正規表示式

基本符號 表示匹配字串的開始位置 例外 用在中括號中 時,可以理解為取反,表示不匹配括號中字串 表示匹配字串的結束位置 表示匹配 零次到多次 表示匹配 一次到多次 至少有一次 表示匹配零次或一次 表示匹配單個字元 表示為或者,兩項中取一項 小括號表示匹配括號中全部字元 中括號表示匹配括號中乙個字元 ...

正規表示式簡單語法及常用正規表示式

表示匹配字串的開始位置 例外 用在中括號中 時,可以理解為取反,表示不匹配括號中字串 表示匹配字串的結束位置 匹配中文字元的正規表示式 u4e00 u9fa5 匹配雙位元組字元 包括漢字在內 x00 xff 匹配空行的正規表示式 n s r 匹配html標記的正規表示式 匹配首尾空格的正規表示式 s...

正規表示式語法及常用的正規表示式

語法請進 看,很詳細 很好 就不複製了。常用正規表示式 正規表示式用於字串處理 表單驗證等場合,實用高效。現將一些常用的表示式收集於此,以備不時之需。匹配中文字元的正規表示式 u4e00 u9fa5 評注 匹配中文還真是個頭疼的事,有了這個表示式就好辦了 匹配雙位元組字元 包括漢字在內 x00 xf...