輕鬆學習正規表示式

2021-06-07 00:01:34 字數 4103 閱讀 8787

英文原文:learn regular expressions (regex) with ease

謝謝合作!

譯文如下:

開篇,談談本文的主要內容

編寫驗證規則最流行和最簡單的方法就是正規表示式了,但唯一的乙個問題是正規表示式的語法太隱晦了,讓人蛋疼無比。很多開發者為了在專案中應用複雜的驗證,經常要使用一些小抄來記住正則式的複雜語法和各種常用命令。

也許你是初學者,那以防萬一,我先來講講什麼是

正規表示式吧:

正規表示式可以幫助我們更好的描述複雜的文字格式。一旦你描述清楚了這些格式,那你就可以利用它們對文字資料進行檢索、替換、提取和修改操作。

下面有乙個正規表示式的簡單例子。第一步先要引入有關正則式的命名空間:

1

usingsystem.text.regularexpressions;

第二步就是用指定的正則式構建乙個正規表示式物件,下面的正則式是用來搜尋長度為10的a-z的英文本母:

1

regex obj =newregex(「[a-z]」);

最後,根據正則式在指定資料中檢索匹配項,如果匹配ismatch方法就會返回true。

1

messagebox.show(obj.ismatch(「shivkoirala」).tostring());

3個重要的正則式命令

記住正則語法最好的辦法就是記住這三樣東西:bracket(括號), caret(插入符號)和dollars(美元符號)。

b在正規表示式中有3種型別的括號

方括號 「[「和花括號「")

好了,現在我們就用上面的3條語法來實現一些正規表示式的驗證規則吧。

檢查使用者是否輸入了shivkoirala?

1

shivkoirala

讓我們開始第乙個驗證,輸入的字元在a-g之間?

1

[a-g]

輸入的字元在a-g之間並且長度為3?

1

[a-g]

輸入的字元在a-g之間並且最大長度為3最小長度為1?

1

[a-g]

我如何在匹配像91230456, 01237648那樣的固定8位數?

1

^[0-9]$

如何驗證最小長度為3最大長度為7的數字,如:123, 1274667, 87654?

1

^[0-9]$

如何驗證像lji1020那樣的發票編號,前3個是字母剩餘為8位長度的數字?

前三個是字母:

1

^[a-z]

後面是8位長度的數字:

1

[0-9]

所以整個表示式為:

1

^[a-z][0-9]$

驗證像inv190203 或 inv820830那樣的前3位是不區分大小寫的英文本母,剩餘8位是數字

在前面的表示式中只能匹配前3個是小寫英文本母的發票編號,如果我們輸入大寫字母那就不能匹配了。所以為了確保前3個字母是不區分大小寫的,我們就要用表示式^[a-za-z]。

完整的正則式如下:

1

^[a-za-z][0-9]$

我們可以驗證簡單的**url格式嗎?

第一步:檢查是否存在www:

1

^www.

第二步:網域名稱必須是長度在1-15的英文本母:

1

. [a-z]

第三部:以.com或者.org結束:

1

. (com|org)$

完整的表示式如下:

1

^www[.][a-z][.](com|org)$

讓我們在來看看bcd(其實也就是上面說的3條基本語法)如何驗證email格式

第一步:email開始是長度在1-10的英文本母,最後跟乙個"@":

1

^[a-za-z0-9]@

第二步:@後面是長度在1-10的英文本母,後面跟乙個".":

1

[a-za-z].

第三步:最後以.com或.org結束:

1

.(com|org)$

最後完整的表示式如下:

1

^[a-za-z0-9]@[a-za-z].(com|org)$

驗證值在0-25的數字:

1

^(([0-9])|([0-1][0-9])|([0-2][0-5]))$

驗證格式為mm/dd/yyyy, yyyy/mm/dd and dd/mm/yyyy的日期:

步驟正則式

描述說明

先來檢查 dd. 首先dd的長度為1-29 ( 2月份) , 1-30 (月小) , 1-31 (月大) .

所以 dd 就是 1-9 或 01-09

[1-9]|0[1-9]

允許使用者輸入1-9或者01-09.

再為dd新增匹配10-19

[1-9]|1[0-9]

允許使用者輸入01-19.

再為dd新增匹配20-29

[1-9]|1[0-9]|2[0-9]

允許使用者輸入01-29.

i再為dd新增匹配30-31

[1-9]|1[0-9]|2[0-9]|3[0-1]

最後使用者可以輸入01-31.

再來匹配日期間的分隔符"/","-"

允許使用者輸入日期分隔符.

mm也是類似的操作

[1-9]|0[1-9]|1[0-2]

讓使用者輸入月份值01-12.

最後就是yy的操作

1[9][0-9][0-9]|2[0][0-9][0-9]

允許使用者輸入年份1900-2099.

最後dd/mm/yyyy格式的日期的正規表示式為:

1

^([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])[- / .]([1-9]|0[1-9]|1[0-2])[- / .](1[9][0-9][0-9]|2[0][0-9][0-9])$

mm/dd/yyyy格式的日期:

1

^([1-9]|0[1-9]|1[0-2])[- / .]([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])[- / .](1[9][0-9][0-9]|2[0][0-9][0-9])$

yyyy/mm/dd格式的日期:

1

^(1[9][0-9][0-9]|2[0][0-9][0-9])[- / .]([1-9]|0[1-9]|1[0-2])[- / .]([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])$

快捷命令

你也可以用以下的快捷命令來簡化你的正規表示式

實際命令

快捷命令

[0-9]

\d[a-z][0-9][_]

\w0次或多次發生

至少一次發生

0次或1次發生

輕鬆學習正規表示式

正規表示式 regular expression 描述了一種字串匹配的模式,可以用來檢查乙個串是否含有某種子串 將匹配的子串做替換或者從某個串中取出符合某個條件的子串等。列目錄時,dir txt或ls txt中的 txt就不是乙個正規表示式,因為這裡 與正則式的 的含義是不同的。正規表示式是由普通字...

輕鬆學習正規表示式

也許你是初學者,那以防萬一,我先來講講什麼是正規表示式吧 正規表示式可以幫助我們更好的描述複雜的文字格式。一旦你描述清楚了這些格式,那你就可以利用它們對文字資料進行檢索 替換 提取和修改操作。下面有乙個正規表示式的簡單例子。第一步先要引入有關正則式的命名空間 using system.text.re...

輕鬆學正規表示式

正規表示式廣泛用於查詢 校驗,無論使用什麼語言開發,或者是日常工作中使用編輯器,掌握正規表示式都能帶來效率上的收穫。我在別人的教程中看過一句話 如果你覺得正規表示式很簡單,要麼你是乙個天才,要麼你不是地球人。不要被嚇到,一旦理解正則後,其實也並不會那麼難,而且它給我們帶來的好處是毋庸置疑的。本文盡量...