詳細講解 正規表示式

2021-10-23 19:59:01 字數 1226 閱讀 2533

正規表示式,又稱規則表示式。(英語:regular expression,在**中常簡寫為regex、regexp或re),電腦科學的乙個概念。正規表示式通常被用來檢索、替換那些符合某個模式(規則)的文字。

許多程式語言都支援利用正規表示式進行字串操作。例如,在perl中就內建了乙個功能強大的正規表示式引擎。正規表示式這個概念最初是由unix中的工具軟體(例如sed和grep)普及開的。正規表示式通常縮寫成「regex」,單數有regexp、regex,複數有regexps、regexes、regexen。

速記技巧:

等價:

等價是等同於的意思,表示同樣的功能,用不同符號來書寫。

?,*,+,\d,\w 都是等價字元

?等價於匹配長度

*等價於匹配長度

+等價於匹配長度

\d等價於[0-9]

\d等價於[^0-9]

\w等價於[a-za-z_0-9]

\w等價於[^a-za-z_0-9]。

常用運算子與表示式:

^ 開始

() 域段

包含,預設是乙個字元長度

[^] 不包含,預設是乙個字元長度

匹配長度

. 任何單個字元(. 字元點)

| 或\ 轉義

$ 結尾

[a-z] 26個大寫字母

[a-z] 26個小寫字母

[0-9] 0至9數字

[a-za-z0-9] 26個大寫字母、26個小寫字母和0至9數字

, 分割

.分割語法:

[a,h,t,w] 包含a或h或t或w字母

[a,h,t,w] 包含a或h或t或w字母

[0,3,6,8] 包含0或3或6或8數字

語法與釋義:

基礎語法 「^({})({})({})katex parse error: undefined control sequence: \d at position 60: …)結束" ?,*,+,\̲d̲,\w 這些都是簡寫的,完全可…」

速記理解:開始 「tel:普通文字」[0-9數字]"-普通文字"[0數字][0-9數字]"-普通文字"[0-9數字] 結束"

等價簡寫後正則寫法:"^tel:\d-[0]\d-\d$" ,簡寫語法不是所有語言都支援。

正規表示式詳細講解

什麼是正規表示式?正規表示式通常被用來檢索 替換那些符合某個規則的文字,使用一系列特殊字元模式,來表示某一類字串。元字元 元字元含義 將下乙個字元標記符 或乙個向後引用 或乙個八進位制轉義符 匹配輸入字行首 匹配輸入行尾 匹配前面的子表示式任意次 匹配前面的子表示式一次或多次 大於等於1次 匹配前面...

正規表示式 詳細講解平衡組

要讀懂這篇文章的精髓,你最好要有一點正則匹配原理的基礎。比如 匹配文字內容 asp163 稍懂正規表示式的人都知道可以匹配,但是你知道他的匹配過程嗎?如果你不太清楚,那麼下面的內容,對你來說可能不太適合,或許,看的太吃力且無法領悟平衡組的用法。因此,我建議你先了解正規表示式nfa引擎的匹配原理。想要...

正規表示式詳細介紹

單個表示 1 d 數字 2 d 非數字 注 大小寫就是取反的意思 3 w 任意乙個字母或數字或下劃線 4 s 空白符 換行 製表符 空格 5 任意字元 除了換行符 自定義字元集合 表示匹配內的任意乙個字元,是乙個或運算,比如 123 就表示是數字1或數字2或數字3 表示非運算,比如 123 表示除了...