正規表示式的簡明概要

2021-10-06 02:40:33 字數 1903 閱讀 1527

## **1. 正規表示式的簡介**
1.1 正規表示式的概念1.2 正規表示式的匹配過程1.3 正規表示式的應用場景2.1 普通字元

2.2 元字元

一些無法書寫或者具有特殊功能的字元,採用在前面加斜槓""進行轉義的方法。

例如下表所示

2.3 預定義匹配字符集

所謂預定義字元就是正規表示式中為我們專門用來匹配格式化內容的字元,例如匹配數字用的 \d 和匹配空白字元的 \s 等等。我們可以利用預定義字元快速的匹配出乙個字串中符合要求的內容。預定義字元匹配的內容,同樣也可以利用字元匹配的方式匹配出來,但是**量會大一點

2.4 重複匹配

以上的表示式無論是匹配一種字元的樣式,還是匹配多種字元其中任意乙個表示式,都只能夠匹配一次。但是 我們需要重複匹配的時候,例如:3666666這種情況,寫成 \d \d \d \d \d \d 這樣太麻煩。所以我們可以使用重複匹配的表示式

2.5 位置匹配和非貪婪匹配

非貪婪匹配

match()函式

flag 匹配模式

search(pattern,string,flags = 0)

在文字內查詢,返回第乙個匹配到的字串。它的返回值型別和使用方法與match()函式是一樣的,唯一區別就是查詢的位置不用固定在文字的開頭

findall(pattern,string,flags = 0)

作為 re 模組的三大搜尋函式之一,findall()與match()和search()的不同之處在於,前兩者都是單值匹配,找到乙個就忽略會面,直接返回不再找了。而findall()是全文查詢,它的返回值是乙個匹配到的字串的列表。這個列表沒有group()方法,沒有start、end、span,更不是乙個匹配物件,僅僅是個列表,如果一項都沒有匹配,則返回空的列表

split(pattern,string,flags = 0,maxsplit)

re 模組的split()方法和字串的split()方法類似,都是利用特定的字元去分割字串,但是re 模組的split()可以使用正規表示式,更加靈活、強大。 maxsplit引數用於指定分割的次數

sub(pattern,repl,string,count = 0,flags = 0)

sub()方法類似於字串的replace()方法,用指定的內容替換匹配到的字元,可以指定替換次數

python的 re 模組有乙個分組功能。所謂的分組就是去已經匹配到的內容,再篩選出需要的內容,相當於二次過濾。 實現分組用圓括號() ,而獲取到分組的內容則是靠group()、groups()

正規表示式 概要

大 小寫,大寫時相反的意思 d 任意乙個數字0 9 w 任意乙個字母數字下劃線 s 空格 製表符 換行符 匹配任意乙個換行符以外的符號,若要匹配所有用 s s 轉義字元 2 8 2 8中的任意乙個數字 1.特殊符號被包含到中括號中失去特殊含義除了 2.標準字元集合,除小數點外,如果被包含於中括號,自...

正規表示式 概要

大 小寫,大寫時相反的意思 d 任意乙個數字0 9 w 任意乙個字母數字下劃線 s 空格 製表符 換行符 匹配任意乙個換行符以外的符號,若要匹配所有用 s s 轉義字元 2 8 2 8中的任意乙個數字 1.特殊符號被包含到中括號中失去特殊含義除了 2.標準字元集合,除小數點外,如果被包含於中括號,自...

正規表示式 概要

大 小寫,大寫時相反的意思 d 任意乙個數字0 9 w 任意乙個字母數字下劃線 s 空格 製表符 換行符 匹配任意乙個換行符以外的符號,若要匹配所有用 s s 轉義字元 2 8 2 8中的任意乙個數字 1.特殊符號被包含到中括號中失去特殊含義除了 2.標準字元集合,除小數點外,如果被包含於中括號,自...