PHP正則匹配特定中文

2021-06-01 23:36:25 字數 383 閱讀 2945

php的正則匹配中文一直比較麻煩,要將漢字轉化為內碼才能匹配得到。這段時間需要用到這方面的東西,但是在網上找不到這方面的資料。所以不得不自己去研究,經過一番摸索。終於實現了特定中文的匹配。 廢話少說,直接上**:

<?php

$html="這是漢字";

preg_match_all("/\xba\xba\xd7\xd6/",$html,$match);

print_r($match);

?>

上面的例子匹配了「漢字」兩個字。其中每個漢字用兩個16進製制數表示。至於這兩個數字怎麼來的。大家可以在這裡查到

比如「漢」字

大家可以看到他的區碼為ba ,位碼也是ba

而「字」字

則為d7 d6所以便有了上面的正則

PHP正則匹配中文字串

正則匹配中文漢字根據頁面編碼不同而略有區別 1.gbk gb2312編碼 x80 xff 或 xa1 xff 2.utf 8編碼 x x u str 使用者名稱123 把結果放在 chinese中 gbk gb2312使用 preg match all x80 xff str,chinese utf...

正則中文匹配

w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是雙位元組的字元 匹配雙位元組字元 包括漢字在內 x00 xff 注 可以用來計算字串的長度 乙個雙位元組字元長度計2,ascii字元計1 ...

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則 匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是...