正規表示式詳解

2021-08-18 19:41:31 字數 2114 閱讀 7154

正規表示式(regular expression),又稱正規表示式、規則表示式等,是電腦科學的乙個概念。正規表示式使用單個字串來描述、匹配一系列匹配某個句法規則的字串,也通常用來檢索、替換那些匹配某個模式的文字。下面從以下方面開始講述正規表示式在python中的應用。

1.在python中使用,首先需要匯入乙個包,即re模組

2.re模組示例

3.一般的使用步驟

(1)使用complie()函式將正規表示式的字串形式編譯為乙個pattern物件

(2)通過pattern物件提供的一系列方法對文字進行匹配查詢,獲得匹配的結果

(3)這些pattern物件提供的方法有:

(4)示例

match():能夠匹配出以***開頭的字串

search():從任何位置開始查詢,一次匹配

findall():全部匹配,返回列表

finditer():全部匹配,返回迭代器

spilt():分割字串,返回列表

sub():替換

字元

作用.

匹配任意1個字元(除\n)

[ ]匹配[ ]中列舉的字元

\d匹配數字,即0-9

\d匹配非數字,即不是數字

\w匹配單詞字元,即a-z、a-z、0-9、_

\w匹配非單詞字元

\s匹配空白,即 空格,tab鍵

\s匹配非空白

.匹配任意乙個字元(除\n)

[ ] 匹配[ ]中列舉的字元

\d 匹配數字,即0-9

\d 匹配非數字

\w 匹配單詞字元

字元

作用

*匹配前乙個字元出現0次或者無限次

+匹配前乙個字元出現1次或者無限次,即至少有1次

?匹配前乙個字元出現1次或者0次

匹配前乙個字元出現m次

匹配前乙個字元至少出現m次

匹配前乙個字元出現從m到n次

* 匹配前乙個字元出現0次或者無限次

+ 匹配前乙個字元出現1次或者無限次,即至少有1次

匹配前乙個字元出現m次

字元作用

^匹配字串開頭

$匹配字串結尾

\b匹配乙個單詞的邊界

\b匹配非單詞邊界

字元作用

|匹配左右任意乙個表示式

(ab)

將括號中字元作為乙個分組

\num

引用分組num匹配到的字串

(?p)

分組起別名

(?p=name)

引用別名為name分組匹配到的字串

| 匹配左右任意乙個表示式

正規表示式詳解

正規表示式 基本正規表示式主要用於grep,egrep,vi,sed,awk命令中進行字串匹配。符號 意義 c 匹配字母c 匹配任意單個字元 匹配前乙個字元出現零次或多次 匹配任意多個任意字元 匹配集合中的任意單個字元,括號中為乙個集合 x y 匹配連續的字串範圍 匹配字串的開頭 匹配字串的結尾 匹...

正規表示式詳解

正規表示式主要作用 分割 匹配 查詢 替換 正規表示式中包括的元素 1.原子 普通字元 a z a z 0 9 原子表 轉義字元 2.元字元 有特殊功能的字元 3.修正模式符 系統內建部分字元,例如 i m s u 原子 1.a z a z 0 9 最常見的字元 2.abc 用圓括號包含起來的單元符...

詳解正規表示式

c 字元c 0n 八進位制0n代表的字元 0 n 7 0nn 八進位制0nn代表的字元 0 n 7 0mnn 八進位制0mnn代表的字元 0 m 3,0 n 7 xnn 十六進製制 0xnn所代表的字元 uhhhh 十六進製制 0xhhhh所代表的字元 t製表符 n換行符 r回車符 f換頁符 a報警...