正規表示式基本規則

2021-08-17 02:45:41 字數 2018 閱讀 9603

正則

解釋\r

回車\n

換行\t

製表符\d

任意乙個數字,0~9 中的任意乙個

\w任意乙個字母或數字或下劃線,也就是 a~z,a~z,0~9,_ 中任意乙個

\s包括空格、製表符、換頁符等空白字元的其中任意乙個

.小數點可以匹配除了換行符(\n)以外的任意乙個字元

「a.\d」 匹配 「aaa100」 得到 「aa1」 匹配到的位置是:開始於1,結束於4

「[bcd][bcd]」 匹配 「abc123」 得到 「bc」 匹配到的位置是:開始於1,結束於3

「[^abc]」 匹配 「abc123」 得到 「1」 匹配到的位置是:開始於3,結束於4

正則

解釋表示式重複n次,比如:」\w」 相當於 「\w\w」;」a」 相當於 「aaaaa」

表示式至少重複m次,最多重複n次,比如:」ba」可以匹配 「ba」或」baa」或」baaa」

表示式至少重複m次,比如:」\w\d」可以匹配 「a12」,」_456」,」m12344」…

?匹配表示式0次或者1次,相當於 ,比如:」a[cd]?」可以匹配 「a」,」ac」,」ad」

+表示式至少出現1次,相當於 ,比如:」a+b」可以匹配 「ab」,」aab」,」aaab」…

*表示式不出現或出現任意次,相當於 ,比如:」\^*b」可以匹配 「b」,」^^^b」… 正則

解釋^與字串開始的地方匹配,不匹配任何字元

$與字串結束的地方匹配,不匹配任何字元

\b匹配乙個單詞邊界,也就是單詞和空格之間的位置,不匹配任何字元

表示式 「^aaa」 在匹配 「*** aaa ***」 時,匹配結果是:失敗。因為 「^」 要求與字串開始的地方匹配,因此,只有當 「aaa」 位於字串的開頭的時候,」^aaa」 才能匹配,比如:」aaa *** ***」。

表示式 「aaa"在

匹配"x

xxaa

a***

"時,匹

配結果是

:失敗。

因為" "在匹

配"xx

xaaa

xxx"

時,匹配

結果是:

失敗。因

為"

」 要求與字串結束的地方匹配,因此,只有當 「aaa」 位於字串的結尾的時候,」aaa$」 才能匹配,比如:」*** *** aaa」。

表示式 「.\b.」 在匹配 「@@@abc」 時,匹配結果是:成功;匹配到的內容是:」@a」;匹配到的位置是:開始於2,結束於4。進一步說明:」\b」 與 「^」 和 「$」 類似,本身不匹配任何字元,但是它要求它在匹配結果中所處位置的左右兩邊,其中一邊是 「\w」 範圍,另一邊是 非」\w」 的範圍。

表示式 「\bend\b」 在匹配 「weekend,endfor,end」 時,匹配結果是:成功;匹配到的內容是:」end」;匹配到的位置是:開始於15,結束於18。

正則解釋|

左右兩邊表示式之間 「或」 關係,匹配左邊或者右邊

()1.在被修飾匹配次數的時候,括號中的表示式可以作為整體被修飾 2.取匹配結果的時候,括號中的表示式匹配到的內容可以被單獨得到

表示式 「tom|jack」 在匹配字串 「i』m tom, he is jack」 時,匹配結果是:成功;匹配到的內容是:」tom」;匹配到的位置是:開始於4,結束於7。匹配下乙個時,匹配結果是:成功;匹配到的內容是:」jack」;匹配到的位置時:開始於15,結束於19。

表示式 「(go\s*)+」 在匹配 「let』s go go go!」 時,匹配結果是:成功;匹配到內容是:」go go go」;匹配到的位置是:開始於6,結束於14。

表示式 「¥(\d+.?\d*)」 在匹配 「$10.9,¥20.5」 時,匹配的結果是:成功;匹配到的內容是:」¥20.5」;匹配到的位置是:開始於6,結束於10。單獨獲取括號範圍匹配到的內容是:」20.5」。

基本正規表示式規則

一 特殊字元 eg bhi b.blucy b 這個意思是以hi開頭的以lucy結尾的不換行的字元 1.b 這個叫元字元,代表單詞的開頭或結尾,即單詞的分界處,只是乙個位置 2.這個叫元字元,匹配 除 換行符外的任意字元 3.1 也是元字元,不代表任何字元,而是指代數量,意味著其前面的內容可以重複數...

正規表示式基本規則

把上面的規則連線起來,就獲得了完整的正規表示式。a za z0 9 a za z com org edu net 2 正規表示式常用符號 3 簡單示例 a 注意 中的正規表示式 coding utf 8 author jiajiknag 待抓取的網頁是 from urllib.request imp...

正規表示式基本規則

a 字元 x 字元 x。舉例 a 表示字元a 反斜線字元。n 新行 換行 符 u000a r 回車符 u000d b 字元類 abc a b 或 c 簡單類 abc 任何字元,除了 a b 或 c 否定 a za z a到 z 或 a到 z,兩頭的字母包括在內 範圍 0 9 0到9的字元都包括 c ...