Python正規表示式整理

2021-09-03 05:12:53 字數 1493 閱讀 3250

目錄

python正規表示式整理

一、正規表示式介紹

二、正規表示式re模組

1、匯入re模組

2、正規表示式過程

三、正規表示式語法

(一)匹配單個字元

(二)匹配多個字元

(三)字串的邊界匹配

(四)分組匹配

在不使用正規表示式的情況下,我們想要實現字串的匹配就必須要單獨的建立乙個函式,通過呼叫函式來實現;為了減少**的編寫,我們不妨將這些函式抽象出來,成為乙個規則。

正規表示式概念1、使用單個字串來描述匹配一系列符合某個句法規則的字串

2、是對字串操作的一種邏輯公式

3、應用場景:處理文字和資料

4、正規表示式過程:依次拿出表示式和文字中的字元比較,如果每乙個字元都能匹配,則匹配成功;否則匹配失敗。

import re

例如:

首先呼叫re中的compile方法,生成乙個pattern物件,然後呼叫這個pattern物件的match等方法;

其中,「.」表示可以匹配任意字元,例如re.match(r'','')是無法匹配的,但是re.match(r'','')可以匹配成功;

「[....]」表示匹配中括號中的任意字元,例如:re.match(r'','')是匹配的,但是re.match(r'','')是不能匹配的;

後面的字元分別表示的是:

「\d」表示匹配數字,「\d」表示匹配非數字;

「\s」表示的是空白,「\s」表示的是非空白;

「\w」表示的是單詞字元(包括a-z,a-z,0-9),「\w」表示的是非單詞字元;

如果要匹配「[a]」這種中括號裡面含有任意字元的情況,那麼需要在正規表示式中新增轉譯符。

其中,「\a」表示指定的字串必須在開頭,例如:ma = re.match(r'\aimooc[\w]*','imoocpython')可以匹配,但是ma = re.match(r'\aimooc[\w]*','iimoocpython')不能匹配;同理,「\z」表示指定字串必須在結尾。

其中,第三種情況多用於匹配xml檔案中的標籤是否有效;

python 正規表示式整理

最近有個任務去匹配網頁 中的url,雖然可以用beautifulsoup 來過濾,但是也可以用正則來處理。對於正則,能夠根據查詢的資料寫出來,不熟練不說,對re模組的函式沒有弄清楚,在這裡進行統一的整理。1.re.match pattern,string,flags 0 是從起始位置進行匹配,如果匹...

正規表示式整理

常見正規表示式驗證 d 整數 d 正整數 d 負整數 a za z0 9 數字和字元 不包含標點 u4e00 u9fa5 中文 0 9 0 9 浮點數 a za z0 9 a za z0 9 a za z0 9 郵箱位址 1 9 0 9 0 9 0 9xx 簡單判斷15位或18位身份證 1 9 0 ...

整理正規表示式

控制開頭 控制結尾 轉義序列 n新行 r回車 t製表符 a z 匹配所有的小寫字母 a z 匹配所有的大寫字母 a za z 匹配所有的字母 0 9 匹配所有的數字 0 9 匹配所有的數字,句號和減號 f r t n 匹配所有的白字元 前面曾經提到 表示字串的開頭,但它還有另外乙個含義。當在一組方括...