python正規表示式的表示和高階用法

在程式設計中，有時需要爬出我們所需要的字元，而且它們可能挨著在一起，也可能分布在**的各個角落，我們今天解決一下要摘出數量的問題。

字元： * 星號程式設計中，表示可以輸出全部，也可以乙個都不輸出，比如 import re ret = re.search(』 .* ',『erdgfrewr』),這時，就可以輸出全部的字串，當字串乙個都沒有的話，也可以乙個都不輸出。

字元：+ 加號在程式設計中，表示出現至少一次，也可以是無限次，比如說 import re ret = re.search (』[a-za-z0-9]+[\w]*』, 'i like china),這個就是說在後面的字串中，找出 a-za-z0-9 和所有的文字，輸出至少乙個。

字元：問號是輸出乙個，對於加了問號的，輸出時，只能輸出乙個字元，要不然就乙個都沒有。

字元：匹配前乙個字元出現 m 次， import re ret = re.search (』[a-za-z0-9]*』, 'i like china),這串**，就表示輸出四個符合前面條件的四個字元。

字元：表示至少輸出m個字元

字元：表示輸出m - n 個字元

表示邊界的字元有表示結束的，表示開始的，表示匹配單詞的邊界，非單詞的邊界。

^ 表示從什麼開始

$ 表示從什麼結束

\b 匹配乙個單詞的邊界

\b 匹配乙個非單詞的邊界

|用豎線分開的，表示匹配其中的乙個

(ab)

將括號中字元作為乙個分組

\num

引用分組num匹配到的字串

(?p)

分組起別名

(?p=name)

引用別名為name分組匹配到的字串

高階用法就是用別的表示式，

findall

sub介紹：

match是我們常用的，都是從開頭來匹配字元，

search用法，讓我們不用從字串的開頭來進行匹配，直接找到我們正規表示式裡需要的字元，但是在匹配中，如果遇到和正規表示式的規則不符合，就會停止，後面還有符合的，也不會去匹配了

findall這個用法，會讓我們匹配到的字元呈現出列表的狀態，而且如果匹配到和表示式中不符合的，也會繼續向後找，只到完全匹配出來為止。

sub將匹配到的資料進行替換

這個就厲害了，當我們想把字串中的資料進行替換時，我們就可以用sub 的形式， import re ret = re.sub(r』english』,『china』,『i love english』』),這時，就可以將english替換成china咯，表示式中的r 是原始字元的意思。

python正規表示式的表示 和高階用法