正規表示式中的限定符

2021-03-31 12:36:01 字數 1719 閱讀 9475

有時候不知道要匹配多少字元。為了能適應這種不確定性,正規表示式支援限定符的概念。這些限定符可以指定正規表示式的乙個給定元件必須要出現多少次才能滿足匹配。

下表給出了各種限定符及其含義的說明:

字元描述

* 匹配前面的子表示式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等價於。

+ 匹配前面的子表示式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價於 。

? 匹配前面的子表示式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價於 。

n 是乙個非負整數。匹配確定的 n 次。例如,'o' 不能匹配 "bob" 中的 'o',但是能匹配 "food" 中的兩個 o。

n 是乙個非負整數。至少匹配n 次。例如,'o' 不能匹配 "bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o' 等價於 'o+'。'o' 則等價於 'o*'。

m 和 n 均為非負整數,其中n

<= m。最少匹配 n 次且最多匹配 m 次。例如,"o" 將匹配 "fooooood" 中的前三個 o。'o' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。

/chapter [1-9][0-9]*/
下面的 vbscript 正規表示式執行同樣的匹配:

"chapter [1-9][0-9]*"
請注意限定符出現在範圍表示式之後。因此,它將應用於所包含的整個範圍表示式,在本例中,只指定了從 0 到 9 的數字。

這裡沒有使用 '+' 限定符,因為第二位或後續位置上並不一定需要乙個數字。同樣也沒有使用 '?' 字元,因為這將把章節數限制為只有兩位數字。在 'chapter' 和空格字元之後至少要匹配乙個數字。

如果已知章節數限制只有99 章,則可以使用下面的 jscript 表示式來指定至少有一位數字,但不超過兩個數字。

/chapter [0-9]/
對 vbscript 可以使用下述正規表示式:

"chapter [0-9]"
上述表示式的缺點是如果有乙個章節號大於 99,它仍只會匹配前兩位數字。另乙個缺點是某些人可以建立乙個 chapter 0,而且仍能匹配。乙個更好的用來匹配兩位數的 jscript 表示式如下:

/chapter [1-9][0-9]?/
或者

/chapter [1-9][0-9]/
對 vbscript 而言,下述表示式與上面等價:

"chapter [1-9][0-9]?"
或者

"chapter [1-9][0-9]"
'*'、'+' 和 '?' 限定符都稱之為貪婪的,也就是說,他們盡可能多地匹配文字。有時這根本就不是所希望發生的情況。有時則正好希望最小匹配。

例如,你可能要搜尋乙個 html 文件來查詢一處包含在 h1 標記中的章節標題。在文件中該文字可能具有如下形式:

下面的表示式匹配從開始的小於號 (<) 到 h1 標記結束處的大於號之間的所有內容。

/<.*>/
vbscript 的正規表示式為:

"<.*>"
如果所要匹配的就是開始的 h1 標記,則下述非貪婪地表示式就只匹配 。

/<.*?>/
或者

"<.*?>"
通過在 '*'、 '+' 或 '?' 限定符後放置 '?',該表示式就從貪婪匹配轉為了非貪婪或最小匹配。

正規表示式簡介(微軟) 11 限定符

限定符 有時候不知道要匹配多少字元。為了能適應這種不確定性,正規表示式支援限定符的概念。這些限定符可以指定正規表示式的乙個給定元件必須要出現多少次才能滿足匹配。下表給出了各種限定符及其含義的說明 字元 描述 匹配前面的子表示式零次或多次。例如,zo 能匹配 z 以及 zoo 等價於。匹配前面的子表示...

VBS教程 正規表示式簡介 限定符

有時候不知道要匹配多少字元。為了能適應這種不確定性,正規表示式支援限定符的概念。這些限定符可以指定正規表示式的乙個給定元件必須要出現多少次才能滿足匹配。下表給出了各種限定符及其含義的說明 字元描述 匹配前面的子表示式零次或多次。例如,zo 能匹配 z 以及 zoo 等價於。匹配前面的子表示式一次或多...

正規表示式中限定符與定位符的使用

目錄快速檢視表 使用正規表示式來檢索符合要求的字串。需要找出固定的字元位置與可變字元的規律,然後用正規表示式中的普通字元 特殊字元 限定符 定位符來描述對應的規律。使用正規表示式描述 1 表達 x 0 9 0 9 0 9 0 9 0 9 0 9 0 9 0 9 0 9 0 9 優化 0 9 0 9 ...