正規表示式

一、常見元字元

\b(\w+)\b\s+\1\b可以用來匹配重複的單詞，像go go, 或者kitty kitty。

這個表示式首先是乙個單詞，也就是單詞開始處和結束處之間的多於乙個的字母或數字(\b(\w+)\b)，這個單詞會**獲到編號為1的分組中，然後是1個或幾個空白符(\s+)，最後是分組1中捕獲的內容（也就是前面匹配的那個單詞）(\1)。

九、常用分組語法：

a）捕獲：

(exp) 匹配exp，並捕獲文字到自動命名的組裡

(?exp) 匹配exp，並捕獲文字到名稱為name的組裡，也可以寫成(?'name'exp)

(?:exp) 匹配exp，不捕獲匹配的文字，也不給此分組分配編號

b）零寬斷言：

(?=exp) 匹配exp前面的位置

(?<=exp) 匹配exp後面的位置

(?!exp) 匹配後面跟的不是exp的位置

(? 匹配前面不是exp的位置

(?=exp)也叫零寬度正**先行斷言，它斷言自身出現的位置的後面能匹配表示式exp。比如\b\w+(?=ing\b)，匹配以ing結尾的單詞的前面部分(除了ing以外的部分)，如查詢i'm singing while you're dancing.時，它會匹配sing和danc。

(?<=exp)也叫零寬度正回顧後發斷言，它斷言自身出現的位置的前面能匹配表示式exp。比如(?<=\bre)\w+\b會匹配以re開頭的單詞的後半部分(除了re以外的部分)，例如在查詢reading a book時，它匹配ading。

假如你想要給乙個很長的數字中每三位間加乙個逗號(當然是從右邊加起了)，你可以這樣查詢需要在前面和裡面新增逗號的部分：((?<=\d)\d)+\b，用它對1234567890進行查詢時結果是234567890。

下面這個例子同時使用了這兩種斷言：(?<=\s)\d+(?=\s)匹配以空白符間隔的數字(再次強調，不包括這些空白符)。

零寬度負**先行斷言(?!exp)，斷言此位置的後面不能匹配表示式exp。例如：\d(?!\d)匹配三位數字，而且這三位數字的後面不能是數字；\b((?!abc)\w)+\b匹配不包含連續字串abc的單詞。

同理，我們可以用(?,零寬度負回顧後發斷言來斷言此位置的前面不能匹配表示式exp：(?(?#comment) 不對正規表示式產生影響，用於注釋