字元編碼中utf 8與gb2312

2021-07-11 10:36:24 字數 666 閱讀 8577

在寫頁面的時候,常常遇到字元編碼的問題,糾結於 utf-8或是gb2312,也就是charset屬性。(如果外部檔案中的字元編碼與主檔案的編碼方式不同,那我們就要用到charset屬性。)

你比如說php檔案本身就是必須是utf-8編碼,輸出頭header("content-type: text/html; charset=utf-8");php連線mysql資料庫時,mysql資料庫字元編碼也是utf-8。

utf編碼:俗稱萬國碼,致力於使用統一的編碼準則表達各國的文字。

為表達更多的文字,utf-8採用2/3混編的方式。目前容納的漢字範圍小於gbk編碼。它也叫unicode編碼。

gb2312編碼:大約包含6000多漢字(不包括特殊字元),編碼範圍為第一位b0-f7,第二位編碼範圍為a1-fe(第一位為cf時,第二位為a1-d3),計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼

gbk編碼:是對gb2312編碼的擴充,容納的漢字更多,但僅僅是擴充,沒有質的變化。保留了所有gb2312編碼,在此基礎上進行編碼範圍的擴充.容納(包含特殊字元)共22014個字元編碼.

gb2312編碼只適合中文**,utf-8是國際通用的標準,**語言可以是其他各國語言,只是中文字元不及gb2312詳;可以這樣想,utf-8包括了gb2312。所以字元編碼的設定還是要看你**的受眾。

c語言中關於utf 8編碼轉換為gb2312的問題

在網上查到如下 問題是 輸出發現gb2312 utf8是沒問題的,但是utf8轉為gb2312時發現只轉換了英文部分,漢字部分並沒有轉換,期待高手釋疑!include include include include define outlen 255 main 轉換 從一種編碼轉為另一種編碼 int...

檔案編碼入門 UTF 8和GB

在簡體中文 windows系統中 1.開啟記事本,輸入 移動 儲存關閉後重新開啟,顯示的仍然是 移動 兩個字。2.重新新建乙個文字檔案,輸入 聯通 儲存關閉後重新開啟,顯示的就不是 聯通 字元了,而是看上去所謂的亂碼。的確,這就是乙個編碼問題。字元需要編碼,一套編碼體系就形成了乙個字符集。美國人最開...

字元編碼之UTF 8

博學,切問,近思 詹子知 http blog.csdn.net zhiqiangzhan utf 8 8 位元 universal character set unicode transformation format 是一種針對unicode的可變長度字元編碼。utf 8 是一種傳輸編碼,他和定長...