JavaScript正規表示式的分組匹配詳解

2021-09-24 15:37:50 字數 4844 閱讀 3571

分組

下面的正規表示式可以匹配kidkidkid:

/kidkidkid/

而另一種更優雅的寫法是:

/(kid)/

這裡由圓括號包裹的乙個小整體稱為分組。

候選

乙個分組中,可以有多個候選表示式,用|分隔:

varreg = /i love (him|her|it)/;

reg.test('i love him')// true

reg.test('i love her')// true

reg.test('i love it')// true

reg.test('i love them')// false

這裡的|相當於「或」的意思。

捕獲與引用

被正規表示式匹配(捕獲)到的字串會被暫存起來。其中,由分組捕獲的串會從1開始編號,於是我們可以引用這些串:

varreg = /(\d)-(\d)-(\d)/

vardate ='2010-04-12'

reg.test(date)

regexp.$1// 2010

regexp.$2// 04

regexp.$3// 12

$1引用了第乙個**獲的串,$2是第二個,依次類推。

與replace配合

string.prototype.replace方法的傳參中可以直接引用**獲的串。比如我們想將日期12.21/2012改為2012-12-21:

varreg = /(\d).(\d)\/(\d)/

vardate ='12.21/2012'

date = date.replace(reg,'$3-$1-$2')// date = 2012-12-21

順道一提,給replace傳迭代函式,有時能優雅地解決一些問題。

將違禁詞轉換為等字數的星號是乙個常見功能。比如文字是kid is a doubi,其中kid與doubi是違禁詞,那麼轉換後應該為*** is a *****。我們可以這麼寫:

varreg = /(kid|doubi)/g

varstr ='kid is a doubi'

str = str.replace(reg,function(word))

巢狀分組的捕獲

如果碰到類似/((kid) is (a (doubi)))/的巢狀分組,捕獲的順序是什麼?來試試:

varreg = /((kid) is (a (doubi)))/

varstr ="kid is a doubi"

reg.test( str )// true

regexp.$1// kid is a doubi

regexp.$2// kid

regexp.$3// a doubi

regexp.$4// doubi

規則是以左括號出現的順序進行捕獲。

反向引用

正規表示式裡也能進行引用,這稱為反向引用:

varreg = /(\w) is \1/

reg.test('kid is kid')// true

reg.test('dik is dik')// true

reg.test('kid is dik')// false

reg.test('dik is kid')// false

\1引用了第乙個被分組所捕獲的串,換言之,表示式是動態決定的。

注意,如果編號越界了,則會被當成普通的表示式:

varreg = /(\w) is \6/;

reg.test('kid is kid');// false

reg.test('kid is \6');// true

分組的型別

分組有四種型別:

捕獲型   - ()

非捕獲型  - (?:)

正向前瞻型 - (?=)

反向前瞻型 - (?!)

我們之前說的都是捕獲型分組,只有這種分組會暫存匹配到的串。

非捕獲型分組

有時候,我們只是想分個組,而沒有捕獲的需求,則可以使用非捕獲型分組,語法為左括號後緊跟?::

varreg = /(?:\d)-(\d)-(\d)/

vardate ='2012-12-21'

reg.test(date)

regexp.$1// 12

regexp.$2// 21

這個例子中,(?:\d)分組不會捕獲任何串,所以$1為(\d)捕獲的串。

正向與反向前瞻型分組

就好像你站在原地,向前眺望:

正向前瞻型分組 - 你前方是什麼東西嗎?

負向前瞻型分組 - 你前方不是什麼東西嗎?

太拗口了,我喜歡稱之為肯定表示式與否定表示式。先舉個正向前瞻的例子:

varreg = /kid is a (?=doubi)/

reg.test('kid is a doubi')// true

reg.test('kid is a shabi')// false

kid is a 後面跟著什麼?如果是doubi才能匹配成功。

而負向前瞻則剛好相反:

varreg = /kid is a (?!doubi)/

reg.test('kid is a doubi')// false

reg.test('kid is a shabi')// true

如果前瞻型分組也不會捕獲值。那麼它與非捕獲型的區別是什麼?看例子:

varreg, str ="kid is a doubi"

reg = /(kid is a (?:doubi))/

reg.test(str)

regexp.$1// kid is a doubi

reg = /(kid is a (?=doubi))/

reg.test(str)

regexp.$1// kis is a

可見,非捕獲型分組匹配到的串,仍會被外層的捕獲型分組捕獲到,但前瞻型卻不會。當你需要參考後面的值,又不想連它一起捕獲時,前瞻型分組就派上用場了。

Javascript正規表示式

這段時間學習js,正好遇到了正規表示式。下面通過使用例項介紹一下正規表示式。正規表示式,又稱正規表示法 常規表示法 英語 regular expression,在 中常簡寫為regex regexp或re 電腦科學的乙個概念。正規表示式使用單個字串來描述 匹配一系列符合某個句法規則的字串。在很多文字...

JavaScript 正規表示式

一 什麼是正規表示式 正規表示式 regular expression 是乙個描述字元模式的物件。測試正規表示式 regexp 物件包含兩個方法 test 和exec 功能基本相似,用於測試字串匹配。test 方法在字串中查詢是否存在指定的正規表示式並返回布林值,如果存在則返回true,不存 在則返...

javascript 正規表示式

正規表示式 regexp物件 主要用於表單驗證 1 建立正規表示式 1 var ret pattern pattern是內容,可以是正規表示式的內容,可以是字元或是其他的內容 2 var rag new regexp pattern 括號內可以是雙引號或者單引號 2 正規表示式的exec方法 reg...