正規表示式總結（一）

要使用這些字元做文字字元是需要用反斜槓「\」進行轉義。例如

匹配1+1=2的正規表示式為：1\+1=2;

字符集由方括號「」括起，告訴正規表示式引擎匹配集合中的單個字元，可以使用連字元「-」定義乙個字元範圍：[a-za-z0-9]。

在左方括號「[」後邊緊跟乙個尖括號「^」，對字符集取反：[^a-za-z1-9]匹配數字字母以外的任何字元。

\d：匹配數字，相當於 [0-9]

\w：匹配單詞字元，相當於 [a-za-z0-9]

\s：匹配空白字元

\d：[^\d]

\w：[^\w]

\s：[^\s]

?：匹配0次或者1次

+：匹配1次或多次

*：匹配0次或多次

：重複少min次，最多max次

：重複至少min次

：重複最多max次

：重複min次

重複匹配符「? + *」是具有貪婪性的：例如要匹配乙個html標籤result」，如果用正規表示式「<.+>」來匹配，則返回的不是我們期望的「」，而是「」。

分析：正規表示式引擎先匹配到第乙個字元「」，之後用「」去匹配後面的任意字元，直到匹配失敗，在本例中會匹配到換行失敗（「.」不匹配換行符），也就是說已經匹配到「result」然後再用「>」回溯匹配，知道回溯找到「>」，匹配成功，因此返回「」。

解決方法：使用懶惰性取代貪婪性

在重複匹配符「? + *」的後面加乙個問號「?」，告訴正則引擎盡可能少的重複上乙個字元。繼續上面的例子，引擎先匹配到「<」成功之後用「.」匹配「h」也成功，緊接著就會用「>」匹配「2」，結果失敗，引擎會進行回溯，用「.+」擴充套件匹配，因此「「^」匹配字串的開始部分。

「$」匹配字串的結束部分。

正規表示式總結 （一）