正規表示式字元

2021-08-31 02:20:32 字數 4144 閱讀 5258

正規表示式符號 

字元 描述 

\  標記下乙個字元是特殊字元或文字。例如,"n" 和字元 "n" 匹配。"\n" 則和換行字元匹配。序列 "\\" 和 "\" 匹配,而 "\(" 則和 "(" 匹配。 

^  匹配輸入的開頭。 

$  匹配輸入的末尾。 

*  匹配前乙個字元零或多次。例如,"zo*" 與 "z" 或 "zoo" 匹配。 

+  匹配前乙個字元一次或多次。例如,"zo+" 與 "zoo" 匹配,但和 "z" 不匹配。  

?  匹配前乙個字元零或一次。例如,"a?ve?" 和 "never" 中的 "ve" 匹配。  

. 匹配除換行字元外的任何單個字元。  

(pattern)  匹配 pattern 並記住該匹配。匹配上的子字串,可以使用 item [0]...[n],來從生成的 matches 集合中取回。要匹配圓括號字元 ( ),則需使用 "\(" 或 "\)"。 

x|y 匹配 x 或 y 

n 是非負整數。共匹配 n 次 

n 是乙個非負整數。至少匹配 n 次。例如,"o" 和 "bob" 中的 "o" 不匹配,但和 "foooood" 中的所有 o 匹配。"o" 與 "o+" 等效。"o" 和 "o*" 等效。

m 和 n 是非負整數。至少匹配 n 次而至多匹配 m 次。例如,"o" 和 "fooooood" 中的前三個 o 匹配。"o" 和 "o?" 等效。 

[ 字元集合。匹配括號內的任一字元。例如,"[abc]" 和 "plain" 中的 "a" 匹配。 

[^xyz 否定字元集合。匹配非括號內的任何字元。例如,"[^abc]" 和 "plain" 中的 "p" 匹配。  

[a-z]  字元範圍。和指定範圍內的任一字元匹配。例如,"[a-z]" 匹配 "a" 到 "z"範圍內的任一小寫的字母表字元。 

[^m-z]  否定字元範圍。匹配不在指定範圍內的任何字元。例如,"[m-z]" 匹配不在 "m" 到 "z"範圍內的任何字元。  

\b  匹配字的邊界,也就是說,在字和空格之間的位置。例如,"er\b" 和 "never" 中的 "er" 匹配,但和 "verb" 中的 "er" 不匹配。 

\b  匹配非字邊界。"ea*r\b" 和 "never early" 中的 "ear" 匹配。 

\d  匹配數字字元。等價於 [0-9]。 

\d  匹配非數字字元。等價於 [^0-9]。 

\f  匹配換頁字元。 

\n  匹配換行字元。 

\r  匹配回車符字元。 

\s  匹配任何空白,包括空格、製表、換頁等。與 "[ \f\n\r\t\v]" 等效。 

\s  匹配任何非空白字元。與 "[^ \f\n\r\t\v]" 等效。

\t  匹配製表字元。 

\v  匹配垂直製表符。 

\w  匹配包括下劃線在內的任何字字元。與 "[a-za-z0-9_]" 等效。 

\w  匹配任何非字字元。與 "[^a-za-z0-9_]" 等效。  

\num  匹配 num,其中 num 是乙個正整數。返回記住的匹配的引用。例如,"(.)\1" 匹配兩個連續的同一字元。 

\n 匹配 n,其中 n 是八進位製換碼值。八進位製換碼值必須是 1、2、或 3 位長。例如,"\11" 和 "\011" 都匹配製表字元。"\0011" 和 "\001" & "1" 是等效的。八進位製換碼值必須不超過 256。如果超過了,則只有前兩位組成表示式。允許在正規表示式中使用 ascii 碼。 

\xn 匹配 n,其中 n 是十六進製製換碼值。十六進製製換碼值必須正好是兩位長。例如,"\x41" 與 "a" 匹配。"\x041" 和 "\x04" & "1" 是等效的。允許在正規表示式中使用 ascii 碼。

字元* 

意義:匹配*前面的字元0次或n次。 

例如:/bo*/匹配"a ghost booooed"中的'boooo'或"a bird warbled"中的'b',但不匹配"a goat g 

runted"中的任何字元。

字元+ 

意義:匹配+號前面的字元1次或n次。等價於。 

例如:/a+/匹配"candy"中的'a'和"caaaaaaandy."中的所有'a'。

字元? 

意義:匹配?前面的字元0次或1次。 

例如:/e?le?/匹配"angel"中的'el'和"angle."中的'le'。

字元(x) 

意義:匹配'x'並記錄匹配的值。 

例如:/(foo)/匹配和記錄"foo bar."中的'foo'。匹配子串能被結果陣列中的素[1], ..., [n] 返 

回,或被regexp物件的屬性$1, ..., $9返回。

字元 意義:這裡的n是乙個正整數。匹配前面的n個字元。 

例如:/a/不匹配"candy,"中的'a',但匹配"caandy," 中的所有'a'和"caaandy."中前面的兩個 

'a'。

字元 意義:這裡的n是乙個正整數。匹配至少n個前面的字元。 

例如:/a不匹配"candy"中的'a',但匹配"caandy"中的所有'a'和"caaaaaaandy."中的所有'a'

字元 意義:這裡的n和m都是正整數。匹配至少n個最多m個前面的字元。 

例如:/a/不匹配"***y"中的任何字元,但匹配 "candy,"中的'a',"caandy," 中的前面兩個 

'a'和"caaaaaaandy"中前面的三個'a',注意:即使"caaaaaaandy" 中有很多個'a',但只匹配前面的三 

個'a'即"aaa"。

字元[xyz] 

意義:一字元列表,匹配列出中的任一字元。你可以通過連字元-指出乙個字元範圍。 

例如:[abcd]跟[a-c]一樣。它們匹配"brisket"中的'b'和"ache"中的'c'。

字元[^xyz] 

意義:一字元補集,也就是說,它匹配除了列出的字元外的所有東西。 你可以使用連字元-指出一 

字元範圍。 

例如:[^abc]和[^a-c]等價,它們最早匹配"brisket"中的'r'和"chop."中的'h'。

字元[b] 

意義:匹配乙個空格(不要與b混淆)

字元b 

意義:匹配乙個單詞的分界線,比如乙個空格(不要與[b]混淆) 

例如:/bnw/匹配"noonday"中的'no',/wyb/匹配"possibly yesterday."中的'ly'。

字元b 

意義:匹配乙個單詞的非分界線 

例如:/wbn/匹配"noonday"中的'on',/ybw/匹配"possibly yesterday."中的'ye'。

字元cx 

意義:這裡的x是乙個控制字元。匹配乙個字串的控制字元。 

例如:/cm/匹配乙個字串中的control-m。

字元d 

意義:匹配乙個數字,等價於[0-9]。 

例如:/d/或/[0-9]/匹配"b2 is the suite number."中的'2'。

字元d 

意義:匹配任何的非數字,等價於[^0-9]。 

例如:/d/或/[^0-9]/匹配"b2 is the suite number."中的'b'。

字元f 

意義:匹配乙個表單符

字元n 

意義:匹配乙個換行符

字元r 

意義:匹配乙個回車符

字元s 

意義:匹配乙個單個white空格符,包括空格,tab,form feed,換行符,等價於[ fnrtv]。 

例如:/sw*/匹配"foo bar."中的' bar'。

字元s 

意義:匹配除white空格符以外的乙個單個的字元,等價於[^ fnrtv]。 

例如:/s/w*匹配"foo bar."中的'foo'。

字元t 

意義:匹配乙個製表符

字元v 

意義:匹配乙個頂頭製表符

字元w 

意義:匹配除數字、字母外及下劃線外的其它字元,等價於[^a-za-z0-9_]。 

例如:/w/或者/[^$a-za-z0-9_]/匹配"50%."中的'%'。

字元n 

意義:這裡的n是乙個正整數。匹配乙個正規表示式的最後乙個子串的n的值(計數左圓括號)。

字元ooctal和xhex 

意義:這裡的ooctal是乙個八進位制的escape值,而xhex是乙個十六進製制的escape值,允許在乙個正規表示式中嵌入ascii碼。

正規表示式相關 正規表示式字元描述

1 字元描述 將下乙個字元標記為特殊字元或字面值。例如 n 與字元 n 匹 配。n 與換行符匹配。序列 與 匹配,與 匹配。匹配輸入的開始位置。匹配輸入的結尾。匹配前乙個字元零次或幾次。例如,zo 可以匹配 z zoo 匹配前乙個字元一次或多次。例如,zo 可以匹配 zoo 但不匹配 z 匹配前乙個...

正規表示式相關 正規表示式字元描述

1 字元描述 將下乙個字元標記為特殊字元或字面值。例如 n 與字元 n 匹 配。n 與換行符匹配。序列 與 匹配,與 匹配。匹配輸入的開始位置。匹配輸入的結尾。匹配前乙個字元零次或幾次。例如,zo 可以匹配 z zoo 匹配前乙個字元一次或多次。例如,zo 可以匹配 zoo 但不匹配 z 匹配前乙個...

python正規表示式元字元 正規表示式

字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...