正規表示式詳解

2021-07-14 16:51:56 字數 1477 閱讀 8475

正規表示式主要作用:分割、匹配、查詢、替換

正規表示式中包括的元素:

1.原子(普通字元:a-z  a-z   0-9   、原子表、轉義字元)

2.元字元(有特殊功能的字元)

3.修正模式符(系統內建部分字元,例如:i、m、s、u)

原子 1.  a-z  a-z  0-9  //最常見的字元

2. (abc)               //用圓括號包含起來的單元符號,匹配圓括號整體

3.[abc]                 //用方括號包含的原子表,匹配方括號中單個字元

4.[^abc]               //用方括號包含的原子表,匹配除方括號中字元外的任意字元

5.轉義字元:

\d    //包含所有數字    [0-9]

\d   //除所有數字外    [^0-9]

\w   //包含所有英文本元  [a-z a-z _ 0-9]

\w  //除所有定義字元外 [^a-z a-z _ 0-9]

\s    //匹配乙個不可見原子  例如:[\f\n\r\t\v]

\s   //匹配乙個可見原子  例如:[^\f\n\r\t\v]

元字元:

*//匹配前乙個內容的0次或者多次

.//匹配內容的0次或者多次,但不包含換行(\n)

+//匹配前乙個內容的1次或者多次

?//匹配前乙個內容的0次或者1次

|//選擇匹配類似php中的|(因為這個運算符號是弱型別,導致前面最為整體匹配),多個選擇乙個匹配

^//匹配字串首部內容

$//匹配字串尾部內容

\b//匹配單詞邊界,邊界可以是空格或者特殊符號

\b//匹配單詞邊界以外內容

//匹配前乙個內容重複次數為m次

//匹配前乙個內容重複次數至少為m次

//匹配前乙個內容重複次數從m到n此

修正模式符:

是正規表示式的乙個增強和補充功能,使用在正則之外,格式/正則/修正模式符

i//正則內容在匹配時不區分大小寫(預設區分)

m//在匹配首內容(^)或者尾部(&)時,採用多行識別匹配,注意:^與$物件是段落的首與尾,而模式修正符m的物件是每一行的句首與句尾

s//將轉義回車(\n)取消,為了單行匹配,如 .匹配時,(.*)

x//忽略正則中的空白

a//強制從頭開始匹配

d//強制$匹配尾部無任何內容(\n)

u//禁止貪婪匹配,只跟蹤到最近的乙個匹配符並結束,常用在採集程式上的正規表示式

技巧:

1.圓括號使用技巧:$mode = '/(a)(b)\\1\\2';   \\1表示(a),\\2表示(b),在處理正則時,圓括號被寫入記憶體中,而\\是讀取圓括號在記憶體中存放位置,其位置以1開始

2.  .*表示匹配所有字元,除換行符(\n)外

3.  \w+表示匹配多個隨機英文本元

正則除錯工具使用:regexpal    (

正規表示式詳解

正規表示式 基本正規表示式主要用於grep,egrep,vi,sed,awk命令中進行字串匹配。符號 意義 c 匹配字母c 匹配任意單個字元 匹配前乙個字元出現零次或多次 匹配任意多個任意字元 匹配集合中的任意單個字元,括號中為乙個集合 x y 匹配連續的字串範圍 匹配字串的開頭 匹配字串的結尾 匹...

正規表示式詳解

正規表示式 regular expression 又稱正規表示式 規則表示式等,是電腦科學的乙個概念。正規表示式使用單個字串來描述 匹配一系列匹配某個句法規則的字串,也通常用來檢索 替換那些匹配某個模式的文字。下面從以下方面開始講述正規表示式在python中的應用。1.在python中使用,首先需要...

詳解正規表示式

c 字元c 0n 八進位制0n代表的字元 0 n 7 0nn 八進位制0nn代表的字元 0 n 7 0mnn 八進位制0mnn代表的字元 0 m 3,0 n 7 xnn 十六進製制 0xnn所代表的字元 uhhhh 十六進製制 0xhhhh所代表的字元 t製表符 n換行符 r回車符 f換頁符 a報警...