python的正規表示式

2021-10-13 08:53:52 字數 1084 閱讀 2442

正規表示式是對字串(包括普通字元(例如,a 到 z 之間的字母)和特殊字元(稱為「元字元」))操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成乙個「規則字串」,這個「規則字串」用來表達對

字串的一種過濾邏輯。正規表示式是一種文字模式,該模式描述在搜尋文字時要匹配的乙個或多個字串。

上面都是官方的說明,通過事先規定好一些特殊字元的匹配規則,然後利用這些字元進行組合來匹配各種複雜的字串場景。比如現在的爬蟲和資料分析,字串校驗等等都需要用到正規表示式來處理資料。

python的正規表示式則是re模組了

re 模組使 python 語言擁有全部的正規表示式功能。

re 模組也提供了與這些方法功能完全一致的函式,這些函式使用乙個模式字串做為它們的第乙個引數。

2.1 match函式

只從字串的最開始與pattern進行匹配,下面是函式的語法 :

re.match(pattern, string, flags = 0)

這裡是引數的描述 :

pattern - 這是要匹配的正規表示式。

string - 這是字串,它將被搜尋用於匹配字串開頭的模式。

flags - 可以使用按位or(|)指定不同的標誌。這些是修飾符,如下表所列。

re.match 函式在成功時返回匹配物件,失敗時返回none。使用match(num)或groups()函式匹配物件來獲取匹配的表示式。

2.2 search 函式

與match()工作的方式一樣,但是search()不是從最開始匹配的,而是從任意位置查詢第一次匹配的內容。下面是這個函式的語法 :

re.match(pattern, string, flags = 0)

這裡是引數的描述 :

pattern - 這是要匹配的正規表示式。

string - 這是字串,它將被搜尋用於匹配字串開頭的模式。

flags - 可以使用按位or(|)指定不同的標誌。這些是修飾符,如下表所列。

re.search函式在成功時返回匹配物件,否則返回none。使用match物件的group(num)或groups()函式來獲取匹配的表示式。

python正規表示式元字元 正規表示式

字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...

python正規表示式及使用正規表示式的例子

正規表示式 正則表達用來匹配字串 正規表示式匹配過程 正規表示式語法規則 匹配除換行 n 外的任意字串 abcabc 轉義字元,使後乙個字元改變原來的意思 a c a c 字符集,對應的位置可以是字符集中任意字元,字符集中的字元可以逐個列出,也可以給出範圍,如 abc 或 a c 第乙個字元如果是 ...

Python 正規表示式

1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...