python 常用正則匹配

2021-06-08 22:00:58 字數 1896 閱讀 7243

^ 匹配輸入字串的開始位置。如果設定了 regexp 物件的multiline 屬性,^ 也匹配 』/n』 或 』/r』 之後的位置。 

$ 匹配輸入字串的結束位置。如果設定了 regexp 物件的multiline 屬性,$ 也匹配 』/n』 或 』/r』 之前的位置。

* 匹配前面的子表示式零次或多次。

+ 匹配前面的子表示式一次或多次。+ 等價於 。

? 匹配前面的子表示式零次或一次。? 等價於 。

n 是乙個非負整數,匹配確定的n 次。

n 是乙個非負整數,至少匹配n 次。

m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數之間不能有空格。

? 當該字元緊跟在任何乙個其他限制符 (*, +, ?, , , ) 後面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜尋的字串,而預設的貪婪模式則盡可能多的匹配所搜尋的字串。

. 匹配除 "/n" 之外的任何單個字元。要匹配包括 』/n』 在內的任何字元,請使用象 』[./n]』 的模式。

(pattern) 匹配pattern 並獲取這一匹配。

(?:pattern) 匹配pattern 但不獲取匹配結果,也就是說這是乙個非獲取匹配,不進行儲存供以後使用。

(?=pattern) 正向預查,在任何匹配 pattern 的字串開始處匹配查詢字串。這是乙個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。

(?!pattern) 負向預查,與(?=pattern)作用相反

x|y 匹配 x 或 y。

[xyz] 字元集合。

[^xyz] 負值字元集合。

[a-z] 字元範圍,匹配指定範圍內的任意字元。

[^a-z] 負值字元範圍,匹配任何不在指定範圍內的任意字元。

/b 匹配乙個單詞邊界,也就是指單詞和空格間的位置。

/b 匹配非單詞邊界。

/cx 匹配由x指明的控制字元。

/d 匹配乙個數字字元。等價於 [0-9]。

/d 匹配乙個非數字字元。等價於 [^0-9]。

/f 匹配乙個換頁符。等價於 /x0c 和 /cl。

/n 匹配乙個換行符。等價於 /x0a 和 /cj。

/r 匹配乙個回車符。等價於 /x0d 和 /cm。

/s 匹配任何空白字元,包括空格、製表符、換頁符等等。等價於[ /f/n/r/t/v]。

/s 匹配任何非空白字元。等價於 [^ /f/n/r/t/v]。

/t 匹配乙個製表符。等價於 /x09 和 /ci。

/v 匹配乙個垂直製表符。等價於 /x0b 和 /ck。

/w 匹配包括下劃線的任何單詞字元。等價於』[a-za-z0-9_]』。

/w 匹配任何非單詞字元。等價於 』[^a-za-z0-9_]』。

/xn 匹配 n,其中 n 為十六進製制轉義值。十六進製制轉義值必須為確定的兩個數字長。

/num 匹配 num,其中num是乙個正整數。對所獲取的匹配的引用。

/n 標識乙個八進位制轉義值或乙個後向引用。如果 /n 之前至少 n 個獲取的子表示式,則 n 為後向引用。否則,如果 n 為八進位制數字 (0-7),則 n 為乙個八進位制轉義值。

/nm 標識乙個八進位制轉義值或乙個後向引用。如果 /nm 之前至少有is preceded by at least nm 個獲取得子表示式,則 nm 為後向引用。如果 /nm 之前至少有 n 個獲取,則 n 為乙個後跟文字 m 的後向引用。如果前面的條件都不滿足,若 n 和 m 均為八進位制數字 (0-7),則 /nm 將匹配八進位制轉義值 nm。

/nml 如果 n 為八進位制數字 (0-3),且 m 和 l 均為八進位制數字 (0-7),則匹配八進位制轉義值 nml。

/un 匹配 n,其中 n 是乙個用四個十六進製制數字表示的unicode字元。

常用正則匹配

正規表示式用於字串處理 表單驗證等場合,實用高效。現將一些常用的表示式收集於此,以備不時之需。匹配中文字元的正規表示式 u4e00 u9fa5 評注 匹配中文還真是個頭疼的事,有了這個表示式就好辦了 匹配雙位元組字元 包括漢字在內 x00 xff 評注 可以用來計算字串的長度 乙個雙位元組字元長度計...

常用正則匹配

一 校驗數字的表示式 1 數字 1 2 n位的數字 d 3 至少n位的數字 d 4 m n位的數字 d 5 零和非零開頭的數字 0 1 9 0 9 6 非零開頭的最多帶兩位小數的數字 1 9 0 9 0 9 7 帶1 2位小數的正數或負數 d d 8 正數 負數 和小數 d d 9 有兩位小數的正實...

正則匹配 Python

1.1 0 1 個字元1.2 放在末尾,兩個對等字元之間 對等字元 所有稱得上是括號的字元 左右對稱 所有非括號字元 自對稱 最小對等字元匹配 比如 匹配下文 最小結果只有順帶地,當有多個匹配結果時,m re.search m.group n 返回第n組括號匹配的字元。只需要一組結果時,用m.gro...