正則中文匹配

2021-10-23 03:47:32 字數 996 閱讀 5717

\w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下

匹配中文字元的正規表示式: [\u4e00-\u9fa5]

或許你也需要匹配雙位元組字元,中文也是雙位元組的字元

匹配雙位元組字元(包括漢字在內):[^\x00-\xff]

注:可以用來計算字串的長度(乙個雙位元組字元長度計2,ascii字元計1)

英文本母: [a-za-z]

數字: [0-9]

匹配中文,英文本母和數字及_: ^[\u4e00-\u9fa5_a-za-z0-9]+$

同時判斷輸入長度:·[\u4e00-\u9fa5_a-za-z0-9_]

^[\w\u4e00-\u9fa5\uf900-\ufa2d]*$

1、乙個正規表示式,只含有漢字、數字、字母、下劃線不能以下劃線開頭和結尾:

^(?!_)(?!.*?_$)[a-za-z0-9_\u4e00-\u9fa5]+$

其中:^ 與字串開始的地方匹配

(?!_)  不能以_開頭

(?!.*?_$)  不能以_結尾

[a-za-z0-9_\u4e00-\u9fa5]+  至少乙個漢字、數字、字母、下劃線

$  與字串結束的地方匹配

//code from

放在程式裡前面加@,否則需要\\進行轉義 @"^(?!_)(?!.*?_$)[a-za-z0-9_\u4e00-\u9fa5]+$"

(或者:@"^(?!_)\w*(?2、只含有漢字、數字、字母、下劃線,下劃線位置不限:

^[a-za-z0-9_\u4e00-\u9fa5]+$

3、由數字、26個英文本母或者下劃線組成的字串

^\w+$

4、2~4個漢字

@"^[\u4e00-\u9fa5]$";

5、^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$

用:(abc)+ 來分析: xyzabcabcabcxyzabcab

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則 匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是...

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是雙...

PHP正則匹配特定中文

php的正則匹配中文一直比較麻煩,要將漢字轉化為內碼才能匹配得到。這段時間需要用到這方面的東西,但是在網上找不到這方面的資料。所以不得不自己去研究,經過一番摸索。終於實現了特定中文的匹配。廢話少說,直接上 html 這是漢字 preg match all xba xba xd7 xd6 html,m...