python 正規表示式

2021-08-09 04:09:15 字數 766 閱讀 5764

先上圖~

分開來說:

1、. 匹配任意除換行符「\n」外的字元;

2、*表示匹配前乙個字元0次或無限次;

3、+或後跟?表示非貪婪匹配,即盡可能少的匹配,如?重複任意次,但盡可能少重複;

4、 .*? 表示匹配任意數量的重複,但是在能使整個匹配成功的前提下使用最少的重複。

如:a.*?b匹配最短的,以a開始,以b結束的字串。如果把它應用於aabab的話,它會匹配aab和ab。

str = 』0123456789′

print str[0:3] #擷取第一位到第三位的字元

print str[:] #擷取字串的全部字元

print str[6:] #擷取第七個字元到結尾

print str[:-3] #擷取從頭開始到倒數第三個字元之前

print str[2] #擷取第三個字元

print str[-1] #擷取倒數第乙個字元

print str[::-1] #創造乙個與原字串順序相反的字串

print str[-3:-1] #擷取倒數第三位與倒數第一位之前的字元

print str[-3:] #擷取倒數第三位到結尾

「]*?>」,其實就是去掉標籤<>,不管標籤<>中有什麼內容,都可以整體去掉,比如我們有一些爬取html中body裡的資料,然後想要去掉各種標籤時,就可以使用此正則匹配。

python正規表示式元字元 正規表示式

字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...

Python 正規表示式

1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...

Python正規表示式

學習python自然而然就不得不面對正規表示式這個難題。當初在沒有學習python之前,自己也曾經嘗試著學習過正規表示式,但是那時候感覺很麻煩,很難懂,結果就是不了了之。但是現在學習python我用的書是 python基礎教程 第二版 這本書中對re模組的講解很簡單易懂,內容不多但起碼把人領進門了,...