一、判斷中文和編碼有關 gbk是雙位元組,utf8是三位元組,可以根據中文的範圍來判斷
編碼範圍
1. gbk (gb2312/gb18030)
\x00-\xff gbk雙位元組編碼範圍
\x20-\x7f ascii
\xa1-\xff 中文
\x80-\xff 中文
2. utf-8 (unicode)
\u4e00-\u9fa5 (中文)
\x3130-\x318f (韓文
\xac00-\xd7a3 (韓文)
\u0800-\u4e00 (日文)
ps: 韓文是大於[\u9fa5]的字元
二、js判斷中文
var str = "php程式設計";if (/^[\u4e00-\u9fa5]+$/.test(str)) else
三、php中判斷中文
$str = "php程式設計";if (preg_match("/^[\x-\x]+$/u",$str)) else
注意:在php中,是用\x表示十六進製制資料
u (pcre_utf8)
此修正符啟用了乙個 pcre 中與 perl 不相容的額外功能。模式字串被當成 utf-8。
js 正規表示式匹配中文
簡單匹配中文方法 u0000 u00ff 匹配非單位元組字元 另錯誤方法 u00 uff 匹配 非單位元組字元 還包括一些全半形符號如,等 還有vwxyz字元 說明 u0000 u00ff.包含unicode單位元組編碼 0 255編碼 包含基本控制字元和拉丁文本母。採用該否定表示式,粗略判斷是否含...
中文正規表示式匹配 正則中文匹配
這篇文章主要講如何使用正則 匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是...
中文正規表示式匹配 正則中文匹配
這篇文章主要講如何使用正則匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是雙...