perl 正規表示式

2021-06-27 19:24:03 字數 3882 閱讀 3106

匹配:m/;/ (還可以簡寫為 /;/ ,略去 m)

替換:s/;/;/

轉化:tr/;/;/

這三種形式一般都和 =~ 或 !~ 搭配使用(其中 "=~" 表示相匹配,在整條語句中讀作 does,"!~" 表示不匹配,在整條語句中讀作 doesn't),並在左側有待處理的標量變數。如果沒有該變數和 =~ !~ 操作符,則預設為處理 $_ 變數中的內容。舉例如下:

$str = "i love perl";

$str =~ m/perl/; # 表示如果在 $str 中發現 "perl" 字串,則返回 "1" 否則返回 "0"。

$str =~ s/perl/bash/; # 表示將變數 $str 中的 "perl" 字串替換為 "bash",如果發生此替換則返回 "1",否則返回 "0"。

$str !~ tr/a-z/a-z/; # 表示將變數 $str 中的所有大寫字母轉化為小寫字母,如果轉化發生了則返回 "0",否則返回 "1"。

另外還有:

foreach (@array)  # 此處每次迴圈將從 @array 陣列中取出乙個元素存放在 $_ 變數中,並對 $_ 進行替換處理。

while (;)  # 這一句稍微複雜一些,他將列印 file 檔案中所有包含 error 字串的行。

perl 的正規表示式中如果出現 () ,則發生匹配或替換後 () 內的模式被 perl 直譯器自動依次賦給系統 $1, $2 ...... 請看下面的例子:

$string = "i love perl";

$string =~ s/(love)/<$1>;/; # 此時 $1 = "love",並且該替換的結果是將 $string 變為 "i ; perl"

$string = "i love perl";

$string =~ s/(i)(.*)(perl)/<$3>;$2<$1>;/; # 這裡 $1 = "i",$2 = " love ",$3 = "perl",並且替換後 $string 變為 "; love ;"

替換操作 s/;/;/ 還可以在末尾加上 e 或 g 引數,他們的含義分別為:

s/;/;/g 表示把待處理字串中所有符合 ; 的模式全部替換為 ; 字串,而不是只替換第乙個出現的模式。

s/;/;/e 表示將把 ; 部分當作乙個運算子,這個引數用的不多。

比如下面的例子:

$string = "i:love:perl";

$string =~ s/:/*/; #此時 $string="i*love:perl";

$string = "i:love:perl";

$string =~ s/:/*/g; #此時 $string="i*love*perl"; 

$string =~ tr/*/ /; #此時 $string="i love perl"; 

$string = "www22cgi44";

$string =~ s/(\d+)/$1*2/e; # (/d+)代表 $string 中的乙個或多個數字字元,將這些數字字元執行 *2 的操作,因此最後 $string 變成了 "www44cgi88"。

下面給出乙個完整的例子:

#!/usr/bin/perl

print"請輸入乙個字串!\n";

$string = ;; # ;代表標準輸入,會讓使用者輸入一字串

chop($string); # 將$string最後乙個換行的字元\n刪除掉

if($string =~ /perl/)

如果輸入的字串含有 perl 這個字串的話,就會顯示後面的提示資訊。

9.2 正規表示式中的常用模式

下面是正規表示式中的一些常用模式。

/pattern/  結果  

. 匹配除換行符以外的所有字元 

x? 匹配 0 次或一次 x 字串 

x* 匹配 0 次或多次 x 字串,但匹配可能的最少次數 

x+ 匹配 1 次或多次 x 字串,但匹配可能的最少次數 

.* 匹配 0 次或一次的任何字元 

.+ 匹配 1 次或多次的任何字元 

匹配剛好是 m 個 的指定字串 

匹配在 m個 以上 n個 以下 的指定字串 

匹配 m個 以上 的指定字串 

匹配符合  內的字元 

[^] 匹配不符合  內的字元 

[0-9] 匹配所有數字字元 

[a-z] 匹配所有小寫字母字元 

[^0-9] 匹配所有非數字字元 

[^a-z] 匹配所有非小寫字母字元 

^ 匹配字元開頭的字元 

$ 匹配字元結尾的字元 

\d 匹配乙個數字的字元,和 [0-9] 語法一樣 

\d+ 匹配多個數字字串,和 [0-9]+ 語法一樣 

\d 非數字,其他同 \d 

\d+ 非數字,其他同 \d+ 

\w 英文本母或數字的字串,和 [a-za-z0-9] 語法一樣 

\w+ 和 [a-za-z0-9]+ 語法一樣 

\w 非英文本母或數字的字串,和 [^a-za-z0-9] 語法一樣 

\w+ 和 [^a-za-z0-9]+ 語法一樣 

\s 空格,和 [\n\t\r\f] 語法一樣 

\s+ 和 [\n\t\r\f]+ 一樣 

\s 非空格,和 [^\n\t\r\f] 語法一樣 

\s+ 和 [^\n\t\r\f]+ 語法一樣 

\b 匹配以英文本母,數字為邊界的字串 

\b 匹配不以英文本母,數值為邊界的字串 

a|b|c 匹配符合a字元 或是b字元 或是c字元 的字串 

abc 匹配含有 abc 的字串 

(pattern) () 這個符號會記住所找尋到的字串,是乙個很實用的語法。第乙個 () 內所找到的字串變成 $1 這個變數或是 \1 變數,第二個 () 內所找到的字串變成 $2 這個變數或是 \2 變數,以此類推下去。  

/pattern/i i 這個引數表示忽略英文大小寫,也就是在匹配字串的時候,不考慮英文的大小寫問題。 

\ 如果要在 pattern 模式中找尋乙個特殊字元,如 "*",則要在這個字元前加上 \ 符號,這樣才會讓特殊字元失效 

下面給出一些例子:    

範例 說明 

/perl/ 找到含有 perl 的字串 

/^perl/ 找到開頭是 perl 的字串 

/perl$/ 找到結尾是 perl 的字串 

/c|g|i/ 找到含有 c 或 g 或 i 的字串 

/cgi/ 找到 c 後面跟著 2個到 4個 g ,再跟著 i 的字串 

/cgi/ 找到 c 後面跟著 2個以上 g ,再跟著 i 的字串 

/cgi/ 找到 c 後面跟著 2個 g,再跟著 i 的字串 

/cg*i/ 找到 c 後面跟著 0個或多個 g ,再跟著 i 的字串,如同/cgi/ 

/cg+i/ 找到 c 後面跟著乙個以上 g,再跟著 i 的字串,如同/cgi/ 

/cg?i/ 找到 c 後面跟著 0個或是 1個 g ,再跟著 i 的字串,如同/cgi/ 

/c.i/ 找到 c 後面跟著乙個任意字元,再跟著 i 的字串 

/c..i/ 找到 c 後面跟著二個任意字元,再跟著 i 的字串 

/[cgi]/ 找到符合有這三個字元任意乙個的字串 

/[^cgi]/ 找到沒有這三個字元中任意乙個的字串 

/\d/ 找尋符合數字的字元,可以使用/\d+/來表示乙個或是多個數字組成的字串 

/\d/ 找尋符合不是數字的字元,可以使用/\d+/來表示乙個或是更多個非數字組成的字串 

/\*/ 找尋符合 * 這個字元,因為 * 在常規表示式中有它的特殊意思,所以要在這個特殊符號前加上 \ 符號,這樣才會讓這個特殊字元失效 

/abc/i 找尋符合 abc 的字串而且不考慮這些字串的大小寫

Perl 正規表示式

正規表示式文中列表 將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個後向引用 或乙個八進位制轉義符。匹配輸入字串的開始位置。如果設定了 regexp 物件的multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束位置。如果設定了 regexp 物件的multiline 屬性...

Perl正規表示式

元字元 元字元的含義是具有特殊含義的字元,即為元字元,元字元包括 點號能夠匹配所有的單字元,但是換行字元除外 n 簡易量詞 記載匹配正規表示式的時候有些需要重複的字元或者字串,我們在表示這種重複的形式的時候,即是量詞,我們知道的量詞有 表示至少重複一次,表示重複一次或者一次 以上,指的是重複一次或者...

Perl正規表示式

b 匹配單詞邊界處的空字元 b 匹配非單詞邊界處的空字元 匹配單詞開頭處的空字元 匹配單詞結尾處的空字 a 匹配絕對行首,換句話說,就是輸入內容的開頭 z 匹配絕對行尾,換句話說,就是輸入內容的絕對尾部 z 匹配絕對行尾或絕對行尾換行符前的位置,換句話說,就是輸入內容的尾部 g 強制從位移指標處進行...