正規表示式學習筆記

2022-08-15 22:27:14 字數 1448 閱讀 4640

\ba\w*\b匹配以字母a開頭的單詞-先是某個單詞開始處(\b),然後是字母a,然後是任意數量的字母或數字(\w*),最後是單詞結束處(\b)。

\d+匹配1個或更多連續的數字。這裡的+是和*類似的特殊**,不同的是*代表重複任意次(可能是0次),而+則代表重複1次或更多次。

\b\w\b 匹配剛好6個字母/數字的單詞

例如:deerchao\.cn匹配deerchao.cn,c:\\windows匹配c:\windows,2\^8匹配2^8(通常這是2的8次方的書寫方式)。

windows\d+匹配windows後面跟1個或更多數字

13\d匹配以13後面跟9個數字(中國的手機號)

^\w+匹配一行的第乙個單詞(或整個字串的第乙個單詞,具體代表哪個意思得看選項設定)

例子:\s+代表不包含空白符的字串。

]+>代表用尖括號括起來的以a開頭的字串。

0\d-\d|0\d-\d這個表示式能匹配兩種以連字型大小分隔的**號碼:一種是三位區號,8位本地號(如010-12345678),一種是4位區號,7位本地號(0376-2233445)。

\(0\d\)[- ]?\d|0\d[- ]?\d這個表示式匹配3位區號的**號碼,其中區號可以用小括號括起來,也可以不用,區號與本地號間可以用連字型大小或空格間隔,也可以沒有間隔。你可以試試用替換|把這個表示式擴充套件成也支援4位區號的。

#

系統自帶的re模組實現正則

importre#

正規表示式& 建立待匹配的字串

src_str = "

python is very best ,bestttt"#

正規表示式,往往在python中,需要在前面加上r

#預設為貪婪模式匹配,盡量多匹配

#re_str =r".+best"

#匹配第乙個就行

re_str = r"

.+?best"#

進行匹配

#match

#只能從頭開始匹配

#如果匹配不上,那就返回none,能匹配上,那麼會返回match的匹配物件

result =re.match(re_str,src_str)

#可以使用match物件中的group()方法獲取返回值

result.group()

pass

#從頭開始查詢,滿足要求的內容就返回

#search

#從頭開始查詢,找到所有滿足正規表示式條件的所有內容返回,返回列表

#findall

#從頭開始查詢,找到所有滿足正規表示式條件的所有內容返回迭代器

#finditer

正規表示式學習筆記

正規表示式學習日記 1 為萬用字元,表示任何乙個字元,例如 a.c 可以匹配 anc abc acc 2 在內可以指定要求匹配的字元,例如 a nbc c 可以匹配 anc abc acc 但不可以匹配 ancc a到z可以寫成 a z 0到9可以寫成 0 9 3 數量限定符號,表示匹配次數 或者叫...

正規表示式學習筆記

字元描述 將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...

正規表示式學習筆記

1.正規表示式是可用於在乙個檔案或字元裡查詢和替代文字的一種標準。它具有兩種標準 基本的正規表示式 bre 擴充套件的正規表示式 ere ere包括bre功能和另外其它的概念。2.表示或運算 3.匹配任何單個字元 4.匹配任何中包含的單個字元,如 張王李 三,匹配張 三 王三,李三 5.將排除 後跟...