Python正規表示式整理

python正規表示式整理

一、正規表示式介紹

二、正規表示式re模組

1、匯入re模組

2、正規表示式過程

三、正規表示式語法

（一）匹配單個字元

（二）匹配多個字元

（三）字串的邊界匹配

（四）分組匹配

在不使用正規表示式的情況下，我們想要實現字串的匹配就必須要單獨的建立乙個函式，通過呼叫函式來實現；為了減少**的編寫，我們不妨將這些函式抽象出來，成為乙個規則。

正規表示式概念1、使用單個字串來描述匹配一系列符合某個句法規則的字串

2、是對字串操作的一種邏輯公式

3、應用場景：處理文字和資料

4、正規表示式過程：依次拿出表示式和文字中的字元比較，如果每乙個字元都能匹配，則匹配成功；否則匹配失敗。

import re

例如：

首先呼叫re中的compile方法，生成乙個pattern物件，然後呼叫這個pattern物件的match等方法；

其中，「.」表示可以匹配任意字元，例如re.match(r'','')是無法匹配的，但是re.match(r'','')可以匹配成功；

「[....]」表示匹配中括號中的任意字元，例如：re.match(r'','')是匹配的，但是re.match(r'','')是不能匹配的；

後面的字元分別表示的是：

「\d」表示匹配數字，「\d」表示匹配非數字；

「\s」表示的是空白，「\s」表示的是非空白；

「\w」表示的是單詞字元（包括a-z，a-z，0-9），「\w」表示的是非單詞字元；

如果要匹配「[a]」這種中括號裡面含有任意字元的情況，那麼需要在正規表示式中新增轉譯符。

其中，「\a」表示指定的字串必須在開頭，例如：ma = re.match(r'\aimooc[\w]*','imoocpython')可以匹配，但是ma = re.match(r'\aimooc[\w]*','iimoocpython')不能匹配；同理，「\z」表示指定字串必須在結尾。

其中，第三種情況多用於匹配xml檔案中的標籤是否有效；

python 正規表示式整理

最近有個任務去匹配網頁中的url，雖然可以用beautifulsoup 來過濾，但是也可以用正則來處理。對於正則，能夠根據查詢的資料寫出來，不熟練不說，對re模組的函式沒有弄清楚，在這裡進行統一的整理。1.re.match pattern,string,flags 0 是從起始位置進行匹配，如果匹...

正規表示式整理

常見正規表示式驗證 d 整數 d 正整數 d 負整數 a za z0 9 數字和字元不包含標點 u4e00 u9fa5 中文 0 9 0 9 浮點數 a za z0 9 a za z0 9 a za z0 9 郵箱位址 1 9 0 9 0 9 0 9xx 簡單判斷15位或18位身份證 1 9 0 ...

整理正規表示式

控制開頭控制結尾轉義序列 n新行 r回車 t製表符 a z 匹配所有的小寫字母 a z 匹配所有的大寫字母 a za z 匹配所有的字母 0 9 匹配所有的數字 0 9 匹配所有的數字，句號和減號 f r t n 匹配所有的白字元前面曾經提到表示字串的開頭，但它還有另外乙個含義。當在一組方括...

Python正規表示式整理

python 正規表示式整理

正規表示式整理

整理正規表示式

相關推薦