利用字元集合區間的正則表達 二

2021-10-12 11:41:05 字數 994 閱讀 6067

利用元字元 [ 和 ] 定義乙個集合,出現在[ 和 ] 之間的所有字元都是集合的組成部分,必須匹配到其中的某個成員,但並非全部,[ ] 不匹配任何字元,它們只負責定義乙個字元集合,是屬於or關係,而不是and關係

正則表達:

[ns]a.\.xls
正則解釋:[ 和 ] 表示定義了乙個集合,[ns]會匹配到以n或s字母開頭字元,普通字元a匹配字元a,\.對.(dot)進行了轉意,表示只匹配到.(dot),普通字元xls匹配字串xls

正則表達:

[hh][tt][mm][ll]
正則解釋:這個正則可以匹配html元素

<html><\head>

正則表達:

[ns]a.[0123456789]\.xls
等價於

[ns]a.[0-9]\.xls
筆記:[0-9] 是字元區間,這樣的合法的字元區間還有很多,例如:

開源中國對ascii表的總結:

不難發現從從ascii值為91-96對應的字元不是大小寫字母,所以這個字元區間a-z一般不常用

注意:-是乙個特殊的元字元,它只有出現在字元集合[ 和 ] 之間的時候才是元字元。在字元集合以外的地方,-只是乙個普通字

字元區間[0-9a-fa-f]可以用於匹配rgb的值

正則表達:

#[0-9a-fa-f][0-9a-fa-f][0-9a-fa-f][0-9a-fa-f][0-9a-fa-f][0-9a-fa-f]
筆記:連續寫6個[0-9a-fa-f]其實很麻煩,後面可以簡化

匹配到正確的結果的正規表示式沒有對錯,只是程式設計師習慣使用哪一種罷了,只要匹配到正確結果的正規表示式都是好的,無論簡繁與否

[ns]a[^0-9].\xls
元字元 ^ 用於排除字元集合,強制排除指定字元集合之外的字元

基本正規表示式字元集合

特殊符號 特殊符號 代表意義 alnum 代表英文大小寫位元組及數字,亦即 0 9,a z,a z alpha 代表任何英文大小寫位元組,亦即 a z,a z blank 代表空白鍵與 tab 按鍵兩者 cntrl 代表鍵盤上面的控制按鍵,亦即包括 cr,lf,tab,del.等等 digit 代表...

正規表示式常用字符集

行首匹配 0或1個 0或多個 1或多個 將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個向後引用 或乙個八進位制轉義符。例如,n 匹配乙個換行符,匹配 而 則匹配 匹配輸入字串的結束位置。如果設定了regexp 物件的 multiline 屬性,也匹配 n 或 r 之前的位 除 n 之外的任何...

Ubuntu基本的正規表示式元字元集合及意義

符號 意義 用於匹配前面乙個普通字元的0次或多次重複 用於匹配任意乙個字元 用於匹配首行,表示行首的字元時 字元後的的那個字元 或字串 用於匹配首尾,符號放在匹配字元之後,與 符號的功能和用法都相反 用於匹配字元集合,該符號支援窮舉方法列出字元集合的所以元素,也支援 使用 符號表示字集合範圍,表明字...