正則常用字符集簡寫

2021-09-29 17:44:38 字數 1015 閱讀 6210

由於有些字符集很常用,所以正規表示式本身就提供了對這類字符集的簡寫

如上圖所示,\s、\s、\d、\d、\w、\w這六個字符集在平時是很常用的,->左邊兩邊的正則,一般情況下,表示的含義是一樣的,也就是等價的。

也許你已經發現了,\s\s只是字母大小寫的區別,代表的字符集就變成相反的了。\s\s是沒有交集的,但它們是互補的,兩個組合起來,剛好是乙個表示所有字元的全集[\s\s]

\d 等價於 [0-9],表示匹配任意乙個數字

\w等價於[a-za-z0-9_],表示匹配任意乙個數字、字母或下劃線

\s等價於[ \t\r\n\f],表示匹配任意乙個空格、製表符、換行或換頁符

\d等價於[^0-9],跟\d相反

\w等價於[^a-za-z0-9_],跟\w相反

\s等價於[^ \t\r\n\f],跟\s相反

簡寫的字符集也可以放到方括號裡面,表示的還是它原來的字符集,例如\d可以寫成[\d]\w可以寫成[\w]\s可以寫成[\s]。也可以這麼寫[\d\s],表示匹配任意乙個數字或空白符。而[^\d\s][\d\s]是等價的,表示的是匹配任意乙個非數字或非空白符。

常用字符集的總結

ascii編碼 主要包括26字母,數字符號,和一些常用符號,用乙個位元組足夠 1個位元組可以表示2 8 256種字元 實際上,這些字元只使用了1個位元組的7位。其中0 127最高位是0,另外128個擴充套件的ascii碼,最高位都是1。它是最通用的單位元組編碼系統。iso8859 1 通常叫做lat...

常用字符集編碼格式詳解

ascii ascii碼是7位編碼,編碼範圍是0x00 0x7f。ascii字符集包括英文本母 阿拉伯數字和標點符號等字元。其中0x00 0x20和0x7f共33個控制字元。只支援ascii碼的系統會忽略每個位元組的最高位,只認為低7位是有效位。hz字元編碼就是早期為了在只支援7位ascii系統中傳...

正規表示式常用字符集

行首匹配 0或1個 0或多個 1或多個 將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個向後引用 或乙個八進位制轉義符。例如,n 匹配乙個換行符,匹配 而 則匹配 匹配輸入字串的結束位置。如果設定了regexp 物件的 multiline 屬性,也匹配 n 或 r 之前的位 除 n 之外的任何...