python中的正規表示式

2021-09-01 23:42:37 字數 1264 閱讀 1690

在python中定義規則(正規表示式),要匯入re模組。

import re

match、r和\:

match

從頭開始匹配

r原生字串\轉義

字元功能

.匹配任意乙個字元,除\n

匹配中列舉的字元

/d匹配數字0-9

/d匹配非數字 [^0-9]

/w匹配數字(0-9)、字母(a-z和a-z)、下劃線(_)

/w匹配 非 數字(0-9)、字母(a-z和a-z)、下劃線(_) [^\w]

/s匹配空格、tab鍵

/s匹配非空格、tab鍵 [^\s]

字元功能

*匹配前乙個字元出現無數次或沒出現

+匹配前乙個字元至少出現1次或無數次

?匹配前乙個字元出現1次或0次

匹配前乙個字元出現m次

匹配前乙個字元出現m到n次

字元功能

^匹配字串開頭,多行匹配每一行開頭

$匹配字串末尾,多行匹配每一行末尾

字元功能

|匹配左右任意乙個表示式(書寫時|左右不留空格)

()將括號中的字元作為乙個分組

\num

引用分組num匹配字串

(?p)

給分組起別名

(?p=name)

引用別名為name分組匹配的規則

方法功能

search

不用從頭開始匹配

findall

統計滿足規則的全部資訊------------>返回的是乙個列表

sub將匹配到的資料進行替換(資料清洗)

正規表示式通常用於在文字中查詢匹配的字串。python裡數量詞預設是貪婪的(在少數語言裡也可能是預設非貪婪),總是嘗試匹配盡可能多的字元;非貪婪的則相反,總是嘗試匹配盡可能少的字元。例如:正規表示式"ab*「如果用於查詢"abbbc」,將找到"abbb"。而如果使用非貪婪的數量詞"ab*?",將找到"a"。

python中的正規表示式

正規表示式是一種用來匹配字串的強有力的 它的設計思想是用一種描述性的語言來給字串定義乙個規則,凡是符合規則的字串,我們就認為它 匹配 了,否則,該字串就是不合法的。因為正規表示式也是用字串表示的,所以,我們要首先了解如何用字元來描述字元。在正規表示式中,如果直接給出字元,就是精確匹配。用 d可以匹配...

Python中的正規表示式

在使用python製作爬蟲之前,我們必須要對python的正規表示式有一定的了解,在python中使用正規表示式要匯入re包 d匹配數字1 9 w匹配字元 匹配集合裡面的字元 匹配前面出現的正規表示式1次或多次 表示匹配任意乙個字元,除換行符除外,x.匹配xy23中的xy,若是x.則匹配出xy2 表...

Python中的正規表示式

對應 abc 001 s r abc 001 加r字首,就不用考慮轉義的問題了。print re.match d d 010 12345 匹配成功返回乙個match物件,否則返回none.re.match 的常見寫法 test 輸入字串 if re.match 正規表示式 test print ok...