讓正規表示式匹配中文(轉貼)

2022-01-28 22:39:54 字數 1073 閱讀 2694

這篇文章主要講如何使用正則匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。

\w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下

匹配中文字元的正規表示式: [\u4e00-\u9fa5]
或許你也需要匹配雙位元組字元,中文也是雙位元組的字元

匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
注:可以用來計算字串的長度(乙個雙位元組字元長度計2,ascii字元計1)

英文本母:[a-za-z]

數字:[0-9]

匹配中文,英文本母和數字及_:

//code from 

^[\u4e00-\u9fa5_a-za-z0-9]+$

同時判斷輸入長度:·

[\u4e00-\u9fa5_a-za-z0-9_]

^[\w\u4e00-\u9fa5\uf900-\ufa2d]*$

1、乙個正規表示式,只含有漢字、數字、字母、下劃線不能以下劃線開頭和結尾:

^(?!_)(?!.*?_$)[a-za-z0-9_\u4e00-\u9fa5]+$
其中:

^ 與字串開始的地方匹配

(?!_)  不能以_開頭

(?!.*?_$)  不能以_結尾

[a-za-z0-9_\u4e00-\u9fa5]+  至少乙個漢字、數字、字母、下劃線

$  與字串結束的地方匹配

放在程式裡前面加@,否則需要\\進行轉義 @"^(?!_)(?!.*?_$)[a-za-z0-9_\u4e00-\u9fa5]+$"

(或者:@"^(?!_)\w*(?2、只含有漢字、數字、字母、下劃線,下劃線位置不限:

^[a-za-z0-9_\u4e00-\u9fa5]+$

3、由數字、26個英文本母或者下劃線組成的字串

^\w+$
4、2~4個漢字

@"^[\u4e00-\u9fa5]$";
5、

^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則 匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是...

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是雙...

js 正規表示式匹配中文

簡單匹配中文方法 u0000 u00ff 匹配非單位元組字元 另錯誤方法 u00 uff 匹配 非單位元組字元 還包括一些全半形符號如,等 還有vwxyz字元 說明 u0000 u00ff.包含unicode單位元組編碼 0 255編碼 包含基本控制字元和拉丁文本母。採用該否定表示式,粗略判斷是否含...