ANSI, UNICODE,UTF8編碼的區別

2021-07-11 15:04:58 字數 934 閱讀 3702

本地化過程中涉及到原始檔和目標檔案的傳輸問題,這時候編碼就顯得很重要。中文的網頁和作業系統中通常採用ansi編碼,這也是微軟os的乙個字元標準。對於ansi,不同的國家和地區制定了不同的標準,由此產生了gb2312(簡體中文),big5(正體中文),jis(日文)等各自的編碼標準。但不同的ansi編碼在不同語言之間是不相容的,所以對於不同的作業系統之間檔案的傳輸,或者在同樣的作業系統下,原始檔語言不同於os的語言檔案的傳輸,

需要轉換成ut8格式

。具體區別:

ansi:16384

個字元。這就是

ansi

字元標準。英文乙個位元組,中文兩個位元組

unicode:

使用兩個位元組對世界上幾乎所有的語言進行編碼

(0x0000

-0xffff

),65536

個字元,每種語言的**段不

同,兩個位元組

(英文、中文都是兩個位元組

)所表達的字元是唯一的,所以不同語種可以共存於文字中,解決國際化的問題

utf8

是unicode

一種壓縮形式

,英文a

在unicode

中表示為

0x0041

,老外覺得這種儲存方式太浪費,因為浪費了

50%的空間,於是就把英文壓縮成

1個位元組,

成了utf8

編碼,但是漢字在

utf8中佔3

個位元組,顯然用做中文不如

ansi

合算,這就是中國的網頁用作

ansi

編碼而老外的網頁常用

utf8

的原因。

在英文os中,要在control and panel settings- regional and language options,standards and formats設成english的。

ANSI, UNICODE,UTF8編碼的區別

本地化過程中涉及到原始檔和目標檔案的傳輸問題,這時候編碼就顯得很重要。中文的網頁和作業系統中通常採用ansi編碼,這也是微軟os的乙個字元標準。對於ansi,不同的國家和地區制定了不同的標準,由此產生了gb2312 簡體中文 big5 正體中文 jis 日文 等各自的編碼標準。但不同的ansi編碼在...

ANSI UNICODE UTF 位元組序 BOM

utf的位元組序和bom utf 8以位元組為編碼單元,沒有位元組序的問題。utf 16以兩個位元組為編碼單元,在解釋乙個utf 16文字前,首先要弄清楚每個編碼單元的位元組序。例如收到乙個 奎 的unicode編碼是594e,乙 的unicode編碼是4e59。如果我們收到utf 16位元組流 5...

8月8日小結

又經歷一次比賽,今天比賽前兩道題都比較簡單,第一題沒有難度,第二題理解起來有些麻煩,看了好一會才搞懂題意,不過被題意帶進坑了去了,題意就是取區間內的數從小到大重新排列,看要求的位置數字有沒有變化,看懂後便直接用sort寫了,測試沒問題,提交就超時,重新優化了幾個地方,依舊是超時,才感覺出來這是個坑。...