正規表示式

2021-10-05 15:33:47 字數 1237 閱讀 3726

正規表示式

import re

字串匹配:

re.match(『ab』,str) 字串str裡匹配ab(只從起始位置匹配)

返回值為下標或none(沒有字元ab返回none)(只匹配字串的開始)

re.search(『bc』,str)(不止匹配開頭,但只匹配第乙個對應字串)

re.findall(『bc』,str)(匹配整個字串,返回值是字串,可以用在正規表示式的匹配中)

re.finditer()(與findall類似,返回的是迭代器)

re.compile(正規表示式)(形成可復用的正規表示式物件,可以用於將相同的正規表示式用於多個字串)

re.split()(正規表示式x,str)(用x分割str)

re.compile(』/d』)(/d表示匹配數字)

sub(『x』,str),subs():用x替換str中所有的適合匹配規則的匹配串,還可以使用特殊符號/1,/2……來引用替換字串中匹配到的分組元素。

[cf]正規表示式表示或,即c或者f。

(cf):正規表示式()表示且,即c且f。

[^cf]: 正規表示式^表示取反,即除了c或者f。

[c-f]: 正規表示式-表示從c到f。

概括字符集的匹配:

\d 0-9

\d 非數字

\w 字元和字母(包括a-z、a-z、0-9、_)

\w 匹配非字元(包括空格、&等字元)

\s+ 匹配乙個或多個空白字元(製表符、空格、換行符)

數量詞匹配:

{3,6}:表示匹配3-6個字元,貪婪機制:條件允許的情況下,匹配的字元多於3。

n*:代表匹配n這個字元0次或者無限多次。

n+:代表匹配n這個字元1次或者無限次

n?:代表匹配n這個字元0次或者1次

忽略大小寫:

re.ignorecase

邊界符的匹配:

『\d』 :表示匹配4到8個數字

^:從字元開始進行匹配

$:字串的末尾

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...