python中的正規表示式

2021-09-06 20:31:54 字數 1064 閱讀 4437

1. 精確匹配,如果直接給出字元,就是精確匹配。

(1)\d可以匹配乙個數字;

(2)\w可以匹配乙個字母或數字;

(3).點符號可以匹配任意字元;

(4)*星符號表示任意個字元;

(5)用+表示至少乙個字元;

(6)用?表示0個或1個字元;

(7)用表示n個字元;

(8)用表示n-m個字元;

(9)\s可以匹配乙個空格(也包括tab等空白符;

(10)由於'-'是特殊字元,在正規表示式中,要用'\'轉義;

(11)用表示範圍;

(12)a|b可以匹配a或b;

(13)^表示行的開頭,^\d表示必須以數字開頭;

(14)$表示行的結束,\d$表示必須以數字結束。

2. 綜合舉例

3. re模組

match()方法判斷是否匹配,如果匹配成功,返回乙個match物件,否則返回none.

4. 切分字串

re.split(r'\s+', 'a b   c    d')

5. 分組

()表示的就是要提取的分組(group),group(0)永遠是原始字串,group(1)group(2)……表示第1、2、……個子串。

6. 貪婪匹配

正則匹配預設是貪婪匹配,也就是匹配盡可能多的字元。加個?就可以讓\d+採用非貪婪匹配。

7. 編譯

編譯正規表示式,如果正規表示式的字串本身不合法,會報錯;用編譯後的正規表示式去匹配字串。

python中的正規表示式

正規表示式是一種用來匹配字串的強有力的 它的設計思想是用一種描述性的語言來給字串定義乙個規則,凡是符合規則的字串,我們就認為它 匹配 了,否則,該字串就是不合法的。因為正規表示式也是用字串表示的,所以,我們要首先了解如何用字元來描述字元。在正規表示式中,如果直接給出字元,就是精確匹配。用 d可以匹配...

Python中的正規表示式

在使用python製作爬蟲之前,我們必須要對python的正規表示式有一定的了解,在python中使用正規表示式要匯入re包 d匹配數字1 9 w匹配字元 匹配集合裡面的字元 匹配前面出現的正規表示式1次或多次 表示匹配任意乙個字元,除換行符除外,x.匹配xy23中的xy,若是x.則匹配出xy2 表...

Python中的正規表示式

對應 abc 001 s r abc 001 加r字首,就不用考慮轉義的問題了。print re.match d d 010 12345 匹配成功返回乙個match物件,否則返回none.re.match 的常見寫法 test 輸入字串 if re.match 正規表示式 test print ok...