學會python正規表示式就是這麼簡單

2021-10-02 03:04:42 字數 3401 閱讀 9703

本篇文章帶大家快速入門正規表示式的使用,正規表示式的規則不僅適用python語言,基本大多數程式語言都適用,在日常使用中極為廣泛,讀者們有必要學好正規表示式。看完這篇文章,讀者們要理解什麼是正規表示式,正規表示式的規則,常見的正規表示式示例,如何在python中使用函式進行正規表示式操作;

正規表示式是指在一串字串中使用特殊的模式匹配獲得子串,我們可以對獲得的子串進行提取,替換等操作

舉個例子zszxz666這個字串,現在知識追尋者想要獲得子串zszxz, 則需要經過乙個模式匹配後獲得子串,在正規表示式中這個模式可以很多種格式,知識追尋者在這邊使用最簡單的模式[a-z]*,然後經過python正規表示式匹配函式就可以獲得子串zszxz;這種方式比平時的字串函式操作更加簡便,適用範圍廣泛;

常用的正規表示式模式如下,如果對這些模式有疑惑的可以參照 正規表示式手冊 ;手冊中還有日常使用的正則示例,比如使用者名稱,密碼,郵箱,url 的匹配模式等;

模式含義

^匹配字串的開頭

$匹配字串的末尾

.匹配任意字元,除了換行符

+匹配前面的子表示式一次或多次

?匹配前面的子表示式零次或一次,或表示乙個非貪婪限定符

*匹配前面的子表示式零次或多次

\轉義特殊字元

\d匹配任意數字,等價於 [0-9]。

\d匹配任意非數字

\s匹配任意空白字元(製表,換行,回車,換頁,垂直製表),等價於[^\f\n\r\t\v]

\s匹配任何非空白字元。等價[^\f\n\r\t\v]

\w匹配數字字母下劃線

\w匹配非數字字母下劃線

[...]

用來表示一組字元;[amk] 匹配 'a','m'或'k'

[^...]

不匹配在中的字元;[^amk]不匹配 'a','m'或'k'

匹配前面的子表示式n 次

匹配前面的子表示式至少n 次

匹配前面的子表示式最少匹配 n 次且最多匹配 m 次

|表示或;a| b,表示匹配a或者b

\b匹配乙個單詞邊界,即字與空格間的位置

\b非單詞邊界匹配

re.i

使匹配對大小寫不敏感

re.l

做本地化識別(locale-aware)匹配

re.m

多行匹配,影響 ^ 和 $

re.s

使 . 匹配包括換行在內的所有字元

re.u

根據unicode字符集解析字元。這個標誌影響 \w, \w, \b, \b.

re.x

該標誌通過給予你更靈活的格式以便你將正規表示式寫得更易於理解

函式名稱

函式含義

re.findall(string, pos, endpos)

匹配所有子串,並返回乙個列表,未匹配,則返回空列表

re.match(pattern, string, flags=0)

從字串的起始位置匹配乙個模式,如果匹配失敗返回none

re.search(pattern, string, flags=0)

掃瞄整個字串並返回第乙個成功的匹配;匹配失敗返回none

re.compile(pattern, flags=0)

編譯正規表示式,生成乙個正規表示式( pattern )物件

re.sub(pattern, repl, string, count=0, flags=0)

查詢和替換

re.finditer(pattern, string, flags=0)

與findall類似,返回的是迭代器

re.split(pattern, string, maxsplit=0, flags=0])

將匹配的子串分割後返回列表

group(num=0) 函式表示提取匹配的表示式,可以使用組號提取對應的匹配結果;知識追尋者想要獲得字串中第乙個出現的數字串;

import re

# 指定模式 至少匹配乙個數字

pattern = re.compile(r'\d+')

# 輸入的字串

mat = pattern.match("451zszxz666")

# 獲得第乙個匹配到的值

g = mat.group();

# 451

print(g)

知識追尋者想要獲得指定的字串,第乙個匹配的就好;

import re

# 想匹配nhzszxz 或者 nh666 或者 nhnh

pattern = re.compile(r'nh(zszxz|666|nh)')

ser = pattern.search('nhzszxzkkk nh666 llll nhnh')

g_0 = ser.group()

# zszxz

print(g_0)

g_1 = ser.group(1)

# nhzszxz

print(g_1)

知識追尋者想要在字串中獲得所有的數字;

import re

pattern = re.compile(r'\d+')

# 輸入的字串

mat = pattern.fidall("451zszxz666")

# ['451', '666']

print(mat)

# 666

print(mat[1])

知識追尋者想要獲得所有非數字的子串;

import re

str = '8556gfggs5555dfg'

# 替換所有數字

result = re.sub(r'\d', '', str)

# gfggsdfg

print(result)

知識追尋者想要獲得以,分割的字串;

import re

str = '123,456,zszxz,666'

result = re.split(',',str)

# ['123', '456', 'zszxz', '666']

print(result)

知識追尋者想要獲得數字451,和666;

import re

pattern = re.compile(r'\d+')

# 輸入的字串

mat = pattern.finditer("451zszxz666")

for it in mat:

print(it.group())

站長工具

學會使用正規表示式

1.用正規表示式判定郵箱是否輸入正確。import re r w w w w e 1546122489 qq.com if re.match r,e print re.match r,e group 0 else print error 2.用正規表示式識別出全部 號碼 import re numb...

python正規表示式元字元 正規表示式

字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...

Python 正規表示式

1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...