正規表示式基本規則

2021-09-19 05:20:27 字數 659 閱讀 7749

a:字元

x 字元 x。舉例:'a'表示字元a

\\ 反斜線字元。

\n 新行(換行)符 ('\u000a')

\r 回車符 ('\u000d')

b:字元類

[abc] a、b 或 c(簡單類)

[^abc] 任何字元,除了 a、b 或 c(否定)

[a-za-z] a到 z 或 a到 z,兩頭的字母包括在內(範圍)

[0-9] 0到9的字元都包括

c:預定義字元類

. 任何字元。我的就是.字元本身,怎麼表示呢? \.

\d 數字:[0-9]

\w 單詞字元:[a-za-z_0-9]

在正規表示式裡面組成單詞的東西必須有這些東西組成

d:邊界匹配器

^ 行的開頭

$ 行的結尾

\b 單詞邊界

就是不是單詞字元的地方。

舉例:hello world?haha;xixi

e:greedy 數量詞

x? x,一次或一次也沒有

x* x,零次或多次

x+ x,一次或多次

x x,恰好 n 次

x x,至少 n 次

x x,至少 n 次,但是不超過 m 次

基本正規表示式規則

一 特殊字元 eg bhi b.blucy b 這個意思是以hi開頭的以lucy結尾的不換行的字元 1.b 這個叫元字元,代表單詞的開頭或結尾,即單詞的分界處,只是乙個位置 2.這個叫元字元,匹配 除 換行符外的任意字元 3.1 也是元字元,不代表任何字元,而是指代數量,意味著其前面的內容可以重複數...

正規表示式基本規則

正則 解釋 r 回車 n 換行 t 製表符 d 任意乙個數字,0 9 中的任意乙個 w任意乙個字母或數字或下劃線,也就是 a z,a z,0 9,中任意乙個 s包括空格 製表符 換頁符等空白字元的其中任意乙個 小數點可以匹配除了換行符 n 以外的任意乙個字元 a.d 匹配 aaa100 得到 aa1...

正規表示式基本規則

把上面的規則連線起來,就獲得了完整的正規表示式。a za z0 9 a za z com org edu net 2 正規表示式常用符號 3 簡單示例 a 注意 中的正規表示式 coding utf 8 author jiajiknag 待抓取的網頁是 from urllib.request imp...