19 4 Python入門之正規表示式

2021-08-15 09:31:01 字數 746 閱讀 2347

貪婪和非貪婪

關於重複的操作,正規表示式預設是啟用貪婪的匹配方式,即在符合情況下,盡可能地去匹配

>>> s = "< html >i love "

>>>re.search('<.+>',s)

<_sre.sre_match object;......,match = '< html >i love

'>

由於貪婪模式的原因。直接匹配了整個字串,我們希望遇到第乙個》停下來,啟用非貪婪模式,即在表示重複的元字元後加上問號

>>> s = "< html >i love "

>>>re.search('<.+?>',s)

<_sre.sre_match object;......,match = '< html >'>

反斜槓+普通字母 = 特殊含義

1)反斜槓加序號

若序號範圍為1-99,則表示引用序號所對應的子組的字串(子組的序號從1開始算起)

2)若序號以0開頭或者是三位數的長度,則用於匹配八進位制數字表示的ascii碼的字元

3)預設情況下,\a與^等效,\z與$等效,預設情況指的是正規表示式標誌的設定,若設定了re.multiline標誌,則^和$還可以匹配換行符的位置,而\a與\z只能匹配字串的起始和結束位置

匹配位置的字元稱為零寬斷言,言下之意,不匹配任何字元,只用於匹配乙個位置

\b也是零寬斷言,表示匹配乙個單詞的邊界(?),單詞定義為unicode的字母數字或下橫線字元

python正則入門 一

假設某一行字串為 str1 445 x 1 findall 獲取匹配到的內容 獲取這一行中的數字,python 如下 親測可用 coding utf 8 import re line str1 445 x list re.findall r str1 d line print list 0 列印找到...

Python學習之正則

python學習目錄 在mac下使用python3 python學習之資料型別 python學習之函式 python學習之高階特性 python學習之函式式程式設計 python學習之模組 python學習之物件導向程式設計 python學習之物件導向高階程式設計 python學習之錯誤除錯和測試 ...

python之正則 一

1.常用正規表示式 d 數字 0 9 例項 a dc a1c d 非數字 d 例項 a dc abc s 空白字元 空格 t r n f v 例項 a sc a c s 非空白字元 s 例項 a sc abc w 單詞字元 a za z0 9 例項 a wc abc w 非單詞字元 w 匹配前乙個字...