正規表示式

2021-09-27 00:26:36 字數 1877 閱讀 5761

小結正規表示式是一組由字母、數字和符號組成的特殊文字, 它可以用來從文字中找出滿足你想要的格式的字元。簡單的說,正規表示式就是對字串操作的一種邏輯公式。

概念解析:

1、它是一種邏輯公式;

2、一種對字串操作的邏輯公式;

3、對字串的一種過濾,搜尋符合限定條件(即邏輯公式)的字串。

正規表示式其實就是在執行搜尋時的格式, 它由一些字母和數字組合而成。例如: 乙個正規表示式 the,它表示乙個規則:由字母t開始,接著是h,再接著是e,匹配的就是其中的』the』。

"the" => the fat cat sat on *the* mat.
占有字元:正規表示式匹配到的東西,不是乙個位置,而且能儲存到匹配的結果當中,這樣的就叫做占有字元。

零寬度:只匹配乙個位置,或者匹配的內容並不儲存到匹配結果中,就稱作零寬度。

正規表示式主要依賴於元字元,元字元不代表他們本身的字面意思,他們都有特殊的含義,一些元字元寫在方括號中的時候有一些特殊的意思。以下是一些元字元的介紹:

元字元描述

.匹配除換行符以外的任意字元

[ ]字元種類. 匹配方括號內的任意字元

[ ^]

否定的字元種類. 匹配除了方括號裡的任意字元

\b匹配單詞開始或結束,它只是匹配乙個位置

^錨點,匹配字串開始

$錨點,匹配字串結束

轉義字元是專門用在元字元身上的,如果你想要得到元字元本身的話需要使用\來取消這些元字元的特殊意義。

首先字元型別是用""包括起來,而且大小寫要區分。

例子:[a-za-z0-9] 這個正規表示式表示:匹配乙個字元,這個字元可以是a-z範圍內或者a-z範圍內或者0-9範圍內的任意小寫或者大寫或數字的字元。

[abc]這個表示:匹配乙個字元,這個字元可以是a,可以是b,也可以是c。

元字元描述

*匹配》=0個重複的在*號之前的字元

+匹配》=1個重複的+號前的字元

?重複0或1次

重複n次

重複至少n次

重複最少n次,最多m次

指的是有幾種規則:用「|」把不同的規則分開

例子:[a]|[b]|[c]|[d] 匹配乙個字元:這個字元可以是a或b或c或d

使用小括號()來指定字表示式:

例子:(\d)\d 表示:把我們分組的小括號裡面的東西重複三次,也就是說我們至少匹配3個最多匹配9個數字,後面再加上三個數字

簡寫描述

\w匹配所有字母數字, 等同於 [a-za-z0-9_]

\w匹配所有非字母數字, 即符號, 等同於: [^\w]

\d匹配數字: [0-9]

\d匹配非數字: [^\d]

\s匹配所有空格字元, 等同於: [\t\n\f\r\p]

\s匹配所有非空格字元: [^\s]

\f匹配乙個換頁符

\n匹配乙個換行符

\r匹配乙個回車符

\t匹配乙個製表符

\v匹配乙個垂直製表符

\p匹配 cr/lf (等同於 \r\n),用來匹配 dos 行終止符

標誌也叫模式修正符, 因為它可以用來修改表示式的搜尋結果. 這些標誌可以任意的組合使用, 它也是整個正規表示式的一部分。

標誌描述

i忽略大小寫

g全域性搜尋

m多行的;錨點元素^ $工作範圍在每行的起始

正規表示式就像是在高考完大學錄取學生一樣:有的學校要省內的,有的學校要省外的;有的學校收普通學生,而有的學校可能只收藝術特長生;有的學校要分數高的,有的學校還是想要分數高的,開個小玩笑哈。正規表示式就是在匹配字串的過程中加一些限制條件,然後選出適合的,中意的。

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...