關於字元編碼的問題。

字串它是乙個資料型別，除此之外，它還是乙個編碼的問題。

因為計算機它只能處理數字，要想處理文字，就必須得把文字轉換成數字，這樣計算機才可以正常處理。

大家都知道ascii碼，這個是外國人發明的，所以最早只有127的個字元被編碼，如數字、字母以及一些特殊符號啥的。如果要處理中文，乙個位元組肯定是不夠的，至少得要兩個，有一些甚至要4個位元組。而且還不能和ascii碼衝突，所以中國人也製作了個編碼叫gb2312。但是，，，，，全國有那麼多種的語言，如果每個國家都自己的編碼的話，那如果一遍文章裡面包含了各國語言，這樣豈不就崩潰了嗎？這也就是有一些同學看見各種亂碼的直接原因。所以，為了統一，unicode也就出來了。亂碼也就不會出現了。

但是，，，比如講 ascii編碼乙個a，它的十進位制是65，二進位制是01000001，

如果用unicode，它的二進位制就是00000000 01000001，雖然結果都是一樣的，

但是明顯後者占得記憶體要大得多，多一倍不必要的儲存空間。

所以。。。。。為了減除這個缺點，utf-8編碼就出來了。

關於字元編碼的問題。

關於字元編碼的問題

關於字元編碼的問題

關於字元編碼的問題

相關推薦