Python正規表示式基礎筆記

2021-08-20 13:39:06 字數 1293 閱讀 4911

ip位址的正規表示式

(\d\.)\d

郵箱驗證的正規表示式

^[a-za-z0-9_.-]+@[a-za-z0-9-]+(\.[a-za-z0-9-]+)*\.[a-za-z0-9]$

\n   匹配乙個換行符

\s   匹配任何空白字元,等價於 [\t\n\r\f].

\s   匹配任意非空字元

\d   匹配任意數字,等價於 [0-9].

\d   匹配任意非數字

\w   匹配字母數字及下劃線

\w   匹配非字母數字及下劃線

*    匹配前面的子表示式(零次)或(多次)。要匹配 * 字元,請使用 \*。

+    匹配前面的子表示式(一次)或(多次)。要匹配 + 字元,請使用 \+。

?    匹配前面的子表示式(零次)或(一次),或指明乙個非貪婪限定符。

a| b

匹配a或b

^    匹配輸入字串的開始位置,除非在方括號表示式中使用,此時它表示不接受該字元集合。要匹配 ^ 字元本身,請使用 \^。

[...]

用來表示一組字元,單獨列出:[amk] 匹配 'a','m'或'k'

[^...]

不在中的字元:[^abc] 匹配除了a,b,c之外的字元。

n 是乙個非負整數。匹配確定的 n 次。例如,'o' 不能匹配 "bob" 中的 'o',但是能匹配"food" 中的兩個 o。

n 是乙個非負整數。至少匹配n 次。例如,'o' 不能匹配 "bob" 中的 'o',但能匹配"foooood" 中的所有 o。'o' 等價於 'o+'。'o' 則等價於 'o*'。

m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o" 將匹配"fooooood" 中的前三個 o。'o' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。

a.*?b  匹配最短的,以a開始,以b結束的字串

a.*b   它將會匹配最長的以a開始,以b結束的字串

re.i  使匹配對大小寫不敏感

re.m  多行匹配,影響 ^ 和 $

re.s  使 . 匹配包括換行在內的所有字元

match函式  

嘗試從字串的(起始位置)匹配乙個模式,如果不是起始位置匹配成功的話,match()就返回none

search函式

掃瞄整個字串並返回(第乙個)成功的匹配。

區別:re.match只匹配字串的開始,如果字串開始不符合正規表示式,則匹配失敗,函式返回none;re.search匹配整個字串,直到找到乙個匹配。

相同:輸出結果都是乙個

基礎正規表示式筆記

筆記 於 鳥哥的linux私房菜 語系的資料會影響到正規表達法的輸出結果,檔案其實記錄的僅有0與1,我們看到的字元文字與數字都是透過編碼表住哪換而來的,由於不同語系的編碼資料並不相同,所有就會造成資料獲取的結果差異。舉例來說,在英文大小寫的編碼順序中,zh tw.big5及c這兩種語系的輸出結果分別...

正規表示式筆記 基礎

常用元字元 匹配除換行符以外的任意字元 w 匹配字母 數字 下劃線 漢字等 w相反 s 匹配任意的空白符 s相反 d 匹配數字 d相反 匹配字串的開始 匹配的是位置 匹配字串的結束 匹配的是位置 注意 s 代表前面開頭的是s,s前面不能有字元。例如 since she job,如果進行匹配,則只匹配...

Python 正規表示式(基礎)

正規表示式 regular expression 是乙個特殊的字串行,描述了一種字串匹配的模式可以用來檢查乙個串是否含有某種子串 將匹配的子串替換或者從某個串中取出符合某個條件的子串,或者是在指定的文章中,抓取特定的字串等。python處理正規表示式的模組是re模組,它是python語言擁有全部的正...