PHP 解決rtrim產生亂碼的問題

2021-07-12 02:43:51 字數 1013 閱讀 9641

$item = '3×魔力之源、300×10鑽石、300000×金幣、';

var_dump( rtrim('、', $item) );

string '3×魔力之源、300×10鑽石、300000×金��' (length=47)

rtrim函式把引數都轉成了utf8後再進行比較。

對於中文,一般都是先轉成unicode,再根據下表轉成utf8。

ucs-4(unicode)編碼utf-8位元組流

u-00000000 – u-0000007f

0******x

u-00000080 – u-000007ff

110***xx 10******

u-00000800 – u-0000ffff

1110***x 10****** 10******

u-00010000 – u-001fffff

11110*** 10****** 10****** 10******

u-00200000 – u-03ffffff

111110xx 10****** 10****** 10****** 10******

u-04000000 – u-7fffffff

1111110x 10****** 10****** 10****** 10****** 10******

「幣」的unicode為\u5e01,轉成二進位制101111000000001,轉成utf8為11100101 10111000 10000001;

「、」的unicode為\u3001,轉成二進位制  11000000000001,轉成utf8為11100011 10000000 10000001;

rtrim是乙個乙個位元組過濾的,可見「幣」的utf8最後變成了11100101 10111000,導致出現了亂碼。

var_dump(mb_substr($item,0,-1,'utf-8'));

string '3×魔力之源、300×10鑽石、300000×金幣'

PHP出現亂碼,解決亂碼的方法

一,出現亂碼的原因分析 1,儲存檔案時候,檔案有自己的檔案編碼,就是漢字,或者其他國語言,以什麼編碼來儲存 2,輸出的時候,要給內容指定編碼,如以網頁的形勢輸入時 3,從資料庫取出資料時,搞不清楚資料庫,設定的字符集 4,以漢字為例,漢字本來也有編碼的,乙個漢字gbk要二個字元,而utf8要三個字元...

PHP解決中文亂碼

在php中,中文亂碼非常頭疼,很麻煩,所以根據在程式設計的經驗,總結以下方法 以utf 8為例 1.php中在頭部header設定編碼方式 hea content type text html charset utf 8 2.php中用iconv轉碼 echo iconv gb2312 utf 8 ...

解決Fedora解壓檔案產生亂碼的問題

最近有發現在使用linux的時候,之前也遇到過在ubuntu下,最後ubuntu貌似在原生下優化了這個問題,現在換到了fedora上的時候問題又出現了,解壓出來的檔案中文亂碼。為了在linux下可以開啟word文件並且保證其格式不出問題,下在了wps,之後開啟壓縮包發現檔名中文字元亂碼,壓縮包是在w...