常用的正規表示式匹配規則

2021-08-28 08:13:43 字數 1586 閱讀 1061

常用的正規表示式匹配規則模式

描述\w

匹配字母、數字、下劃線,等價於[a-za-z0-9_]\w可以匹配漢字(python),

\w匹配不是字母、數字、下劃線的其他字元

\s匹配任意空白字元,等價於(\t\n\r\f)

\s匹配任意非空字元

\d匹配數字,等價於[0-9]

\d匹配不是數字的字元

\a匹配字串開頭

\z匹配字串結尾的,如果存在換行,只匹配到換行前的結束字串

\z匹配字串結尾的,如果存在換行,匹配到換行符\n

\g最好完成匹配的位置

\n匹配乙個換行符

\t匹配乙個製表符(tab)

^匹配一行字串的開頭

$匹配一行字串的結尾

.匹配任意字元,除了換行符.當re.dotall標記被指定時,這可以匹配包括換行符在內的任字元

[…]用來表示一組字元,比如[abc]表示匹配a或b或c,[a-z],[0-9]

[^…]

匹配不在裡面的字元,比如[^abc]匹配除a,b,c以外的字元

*匹配0個或多個字元

+匹配1個或多個字元

?匹配0個或1個前面的正規表示式片段,(.*?)表示盡可能少地匹配字元(後面詳解)

精確匹配前面n個前面的表示式,如\d表示匹配5個數字

匹配前面的表示式n到m次,貪婪模式

a|b匹配a或者b

(…)匹配括號裡的表示式,也可以表示乙個組

這個表很重要,但也不用死記硬背,因為又不是讓你考試,下面會列舉一些非常常用的匹配規則,剩下的就等要用了再查表就可以了

[1-9]\d(?!\d)
更多正規表示式可以參考下面這篇文章:

最全的常用正規表示式大全——包括校驗數字、字元、一些特殊的需求等等 - zxin -

正規表示式 匹配規則

一切從最基本的開始。模式,是正規表示式最基本的元素,它們是一組描述字串特徵的字元。模式可以很簡單,由普通的字串組成,也可以非常複雜,往往用特殊的字元表示乙個範圍內的字元 重複出現,或表示上下文。例如 once這個模式包含乙個特殊的字元 表示該模式只匹配那些以once開頭的字串。例如該模式與字串 on...

正規表示式 匹配規則

一切從最基本的開始。模式,是正規表示式最基本的元素,它們是一組描述字串特徵的字元。模式可以很簡單,由普通的字串組成,也可以非常複雜,往往用特殊的字元表示乙個範圍內的字元 重複出現,或表示上下文。例如 once這個模式包含乙個特殊的字元 表示該模式只匹配那些以once開頭的字串。例如該模式與字串 on...

正規表示式的匹配規則

大部分字元在正規表示式中,就是字面的含義,比如 a 匹配 a,b 匹配b。這種只表示它字面量含義的被稱為字面量字元。除了字面量,還有一些字元有特殊含義,不代表字面意思,被稱為元字元 1,點字元 點字元匹配除回車 r 換行 n 行分隔符 u2028 和分段符 u2029 之外的所有字元 注 碼點大於0...