用PHP正規表示式匹配中文

2021-07-05 18:59:30 字數 609 閱讀 4820

**:

在ansi(gb2312)環 境下

匹配全部的gb2312編 碼表的字元:/[「.chr(0xb0).」-「.chr(0xf7).」]+/

單純匹配漢字而不匹配全形標點:/([「.chr(0xb0).」-「.chr(0xf7).」][「.chr(0xa1).」-「.chr(0xfe).」])/

該表示式能匹配乙個中文字元。

匹配全形標點而不匹配漢字:/([「.chr(0xa1).」-「.chr(0xa3).」][「.chr(0xa1).」-「.chr(0xff).」])/

utf-8環 境下中文的匹配

漢字編碼範圍是0x4e00-0x9fa5,於 是正則式可以這樣寫:/[\x-\x]/u

\x表示字 符的十六進製制形式,更多資訊請 自己檢視php手 冊。要特別注意的是模 式修正符u,php手冊裡這樣說:u(pcre_utf8)此修正符啟用了乙個pcre中與perl不相容的額外功能。模式字串被當成utf-8。本修正符在unix下自php 4.1.0起可用,在win32下自php 4.2.3起可用。自php 4.3.5起開始檢查模式的utf-8合法性。這正是正確匹配所必須的。其實也想提醒一下,是utf-8環境使用元字元匹配字串最好加上修正符u,這只是經驗。

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則 匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是...

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是雙...

php用正規表示式匹配中文例項詳解

在php中漢字正則可能有些朋友覺得很簡單,但是在使用時會發現在gbk編碼與uft8編碼可能會有點區別哦,下面小編來介紹一下。gbk編碼下漢字正則 1.判斷字串是否全是漢字 複製 如下 str 全部是漢字測試 if preg match all x81 xfe x40 xfe str,match el...