正規表示式筆記

2021-08-28 07:29:54 字數 2283 閱讀 8825

標識

釋義.匹配除換行符以外的任意字元

\w匹配字母,數字,下劃線,漢字

\s匹配任意空白符

\d匹配數字

\b匹配單詞的開始或結束

^匹配字串的開始

$匹配字串的結束

在查詢.\()^*等在正規表示式中代表特殊含義的字元時。

如:www.baidu.comwww\.baidu\.com

常用轉義字元

標識釋義

\a報警字元(列印它的效果是電腦嘀一聲)

\b通常是單詞分界位置,但如果在字元類裡使用代表退格

\t製表符,tab

\r回車

\v豎向製表符

\f換頁符

\n換行符

標識釋義

*重複0或更多次

+重複1次或更多次

重複1次或0次

重複n次

重複n次或更多次

重複n到m次

標識釋義

[aeiou]aeiou中任意字元

[0-9]匹配任意乙個數字,等同於\d

[a-z0-9a-z]等同於\w(如果只考慮英文的話)

標識釋義

\w匹配任意不是字母,數字,下劃線,漢字的字元

\s匹配任意不是空白符的字元

\d匹配任意非數字的字元

\b匹配不是單詞開關或結束位置

[^x]匹配除了x以外的任意字元

[^aeiou]匹配除了aeiou這幾個字母以外的任意字元

例:]+>匹配用尖括號括起來的以a開關的字串

使用替換時,順序是很重要的。

在匹配替換時,將會從左到或地測試每個分枝條件,如果滿足了某個分枝的話,就不會支管其它的替換條件了。

例:windows98|windows2000|windowsxp

用()括起來的分組

(exp)匹配exp,並捕獲文字到自動命名的組裡

(?#comment)用來注釋

使用小括號的分組,都有乙個組號,從左到右從1開始

後向引用 用於重複搜尋前面某個分組匹配的文字

例:

\b(\w+)\b\s+\1\b匹配重複的單詞,如go go, ok ok

標識

釋義(?=exp)匹配exp前面的位置【0寬先行斷言】

(?<=exp)匹配exp後面的位置【0寬後行斷言】

(?!exp)匹配後面跟的不是exp的位置

(?匹配前面不是exp的位置

例:

(?正規表示式在匹配字元時,通常是匹配盡可能多的字元。

標識釋義

*?重複任意次,但盡可能少重複

+?重複1次或更多次,但盡可能少重複

??重複0次或1次,但盡可能少重複

?重複n到m次,但盡可能少重複

?重複n次以上,但盡可能少重複

例:字串aabab

a.*?b匹配aab

a.*b匹配aabab

正規表示式 正規表示式函式 筆記

筆記直接使用pycharm製作,需要原始檔請私聊。正規表示式函式 1.match 2.search 3.全域性匹配函式 全域性匹配 re.compile 正規表示式 findall 資料 import re string poythonydasadcasa pat2 p.y 懶惰模式執行 較精準 r...

正規表示式筆記

不同的語系編碼的順序不一樣 lang c 0 1 2 3 a b c d z a b c d z lang zh cn 0 1 2 3 4 a a b b c c z z 使用正規表示式時,需要留意環境的語系是什麼,否則會有不同的結果 alnum 英文大小寫字元及數字 0 9 a z a z alp...

正規表示式筆記

d 0 9中的任意乙個數字 w a z,a z,0 9,中的任意乙個,即字母數字下劃線 s 空格,製表符,換頁符等空白字元的其中任意乙個 小數點可以匹配換行符 n 以外的任意乙個字元 匹配某範圍內的任意乙個字元 ab9 匹配 a b 9 中的任意乙個 abc 匹配abc之外的任意乙個字元 a g 匹...