ansii unicode utf8 區別和關係

2022-03-26 05:04:27 字數 686 閱讀 6618

本地化過程中涉及到原始檔和目標檔案的傳輸問題,這時候編碼就顯得很重要。中文的網頁和作業系統中通常採用ansi編碼,這也是微軟os的乙個字元標準。對於ansi,不同的國家和地區制定了不同的標準,由此產生了gb2312(簡體中文),big5(正體中文),jis(日文)等各自的編碼標準。但不同的ansi編碼在不同語言之間是不相容的,所以對於不同的作業系統之間檔案的傳輸,或者在同樣的作業系統下,原始檔語言不同於os的語言檔案的傳輸,需要轉換成ut8格式。

具體區別:

ansi:16384個字元。這就是ansi字元標準。英文乙個位元組,中文兩個位元組

unicode: 使用兩個位元組對世界上幾乎所有的語言進行編碼(0x0000-0xffff),65536個字元,每種語言的**段不 同,兩個位元組(英文、中文都是兩個位元組)所表達的字元是唯一的,所以不同語種可以共存於文字中,解決國際化的問題

utf8是unicode一種壓縮形式,英文a在unicode中表示為0x0041,老外覺得這種儲存方式太浪費,因為浪費了50%的空間,於是就把英文壓縮成1個位元組,成了utf8編碼,但是漢字在utf8中佔3個位元組,顯然用做中文不如ansi合算,這就是中國的網頁用作ansi編碼而老外的網頁常用utf8的原因。

在英文os中,要在control and panel settings- regional and language options,standards and formats設成english的。

ICMP協議型別0和8區別

icmp協議型別 0和8的區別 0 回顯應答,表示回顯自己對別人的請求 8 回顯請求,表示回顯別人對自己的請求 下面用防火牆和ping命令來演示 iptables f iptables p input drop 設定預設input鏈規則為全部拒絕 iptables a input p icmp ic...

mysql中utf8和utf8mb4區別

mysql在5.5.3之後增加了這個utf8mb4的編碼,mb4就是most bytes 4的意思,專門用來相容四位元組的unicode。好在utf8mb4是utf8的超集,除了將編碼改為utf8mb4外不需要做其他轉換。當然,為了節省空間,一般情況下使用utf8也就夠了。二 內容描述 那上面說了既...

mysql中utf8和utf8mb4區別

mysql在5.5.3之後增加了這個utf8mb4的編碼,mb4就是most bytes 4的意思,專門用來相容四位元組的unicode。好在utf8mb4是utf8的超集,除了將編碼改為utf8mb4外不需要做其他轉換。當然,為了節省空間,一般情況下使用utf8也就夠了。二 內容描述 那上面說了既...