php和JS正規表示式匹配中文

2022-05-15 11:04:22 字數 716 閱讀 1833

一、判斷中文和編碼有關 gbk是雙位元組,utf8是三位元組,可以根據中文的範圍來判斷   

編碼範圍

1. gbk (gb2312/gb18030)   

\x00-\xff gbk雙位元組編碼範圍   

\x20-\x7f ascii   

\xa1-\xff 中文   

\x80-\xff 中文  

2. utf-8 (unicode)   

\u4e00-\u9fa5 (中文)   

\x3130-\x318f (韓文   

\xac00-\xd7a3 (韓文)   

\u0800-\u4e00 (日文)   

ps: 韓文是大於[\u9fa5]的字元 

二、js判斷中文

var str = "php程式設計";

if (/^[\u4e00-\u9fa5]+$/.test(str)) else

三、php中判斷中文

$str = "php程式設計";

if (preg_match("/^[\x-\x]+$/u",$str)) else

注意:在php中,是用\x表示十六進製制資料

u (pcre_utf8)

此修正符啟用了乙個 pcre 中與 perl 不相容的額外功能。模式字串被當成 utf-8。

js 正規表示式匹配中文

簡單匹配中文方法 u0000 u00ff 匹配非單位元組字元 另錯誤方法 u00 uff 匹配 非單位元組字元 還包括一些全半形符號如,等 還有vwxyz字元 說明 u0000 u00ff.包含unicode單位元組編碼 0 255編碼 包含基本控制字元和拉丁文本母。採用該否定表示式,粗略判斷是否含...

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則 匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是...

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是雙...