學習 UTF 8和GBK的區別

2022-03-19 03:08:10 字數 1182 閱讀 8249

論編碼問題又碰到了,為什麼不用utf8而用gbk呢?這個問題專業的解釋好像網上有很多,但對我來講,我只想知道用哪個有什麼好處

就夠了。

下面是我用我個人應用中感覺到的及最簡單的通俗的看法去理解這兩種編碼的區別?

感覺上區別2:用dw編碼utf8字型時感覺看不清楚,gb2312比較清楚。

位元組上區別3:從位元組上區分  gbk的文字編碼是雙位元組來表示的,占用空間大,utf-8編碼則是用以解決國際上字元的一種多位元組編碼,它

對英文使用8位(即乙個位元組),對於英文本元較多的論壇則用utf-8節省空間。

字元上區分4:gbk包含全部中文字元;

utf-8則包含全世界所有國家需要用到的字元。

編碼上區分5:gbk是在國家標準gb2312基礎上擴容後相容gb2312的標準(好像還不是國家標準)

utf-8編碼的文字可以在各國各種支援utf8字

所以,對於英文

比較多的論壇

,使用gbk則每個字元占用2個位元組,而使用utf-8英文卻只佔乙個位元組。 

使用上區分6:gbk是中國國家編碼,通用性比utf8差,不過utf8占用的資料庫比gbk大,而且是一般做論壇的dz這些程式,對應的元件和插

件支援上gbk相應開發的比較全面點,再diy的時候比較方便。utf8是國際編碼,它的通用性比較好,外國人也可以瀏覽論壇,而且中文可以

直接識別,如果你的論壇要做的比較國際化那就必須用utf8的。補充下:utf8再繁體支援上比gbk有優勢滴。對於dz論壇來說,很多外掛程式都

只支援gbk的,如果需要裝較多外掛程式的論壇還是用gbk比較好,而對裝較少外掛程式且有特殊使用者群的論壇用utf8比較好。所以,一般你要是做論

壇只是國內的特定圈子裡的就用gbk簡單點,基本外掛程式都可以安裝,但是如果你的站有國外的市場需要就建議utf8了。

下現是一組編碼收錄字元的資料:

gb2312(2023年)一共收錄了7445個字元,包括6763個漢字和682個其它符號;   

2023年的漢字擴充套件規範gbk1.0收錄了21886個符號,它分為漢

字區和圖形符號區。漢字區包括21003個字元。 

2023年的gb18030是取代gbk1.0的正式國家標準。該標準收錄了27484個漢字,同時還收錄

了藏文、蒙文、維吾爾文等主要的少數民族文字。現在的pc平台必須支援gb18030,對嵌入式產品暫不作要求。所以手機、***一般只支援

gb2312。

UTF 8和GBK的區別

utf 8和gbk的區別 2009年06月09日 星期二 下午 02 00 gbk是國家標準gb2312基礎上擴容後相容gb2312的標準。gbk的文字編碼是用雙位元組來表示的,即不論中 英文本元均使用雙位元組來表示,為了區分中文,將其最高位都設定成1。gbk包含全部中文字元,是國家編碼,通用性比u...

GBK和UTF8的區別

gbk和utf8的區別 gbk編碼 是指中國的中文字元,其它它包含了簡體中文與正體中文本元,另外還有一種字元 gb2312 這種字元僅能儲存簡體中文本元。utf 8編碼 它是一種全國家通過的一種編碼,如果你的 涉及到多個國家的語言,那麼建議你選擇utf 8編碼。gbk和utf8有什麼區別?utf8編...

GBK和UTF 8的區別

我們這裡將以最簡單最容易理解的方式來描述gbk和utf8的區別,以及它們分別是什麼。gbk編碼 是指中國的中文字元,其它它包含了簡體中文與正體中文本元,另外還有一種字元 gb2312 這種字元僅能儲存簡體中文本元。utf8編碼格式很強大,支援所有國家的語言,正是因為它的強大,才會導致它占用的空間大小...