字元的編碼與解碼

2021-09-29 20:54:37 字數 445 閱讀 8604

ascii碼 : 7bit表示乙個字元,共計128個字元

iso-8859-1: 8bit表示乙個字元,乙個位元組(byte)表示乙個字元,共計256個字元

gb2312  簡體中文的國標碼,2個位元組表示乙個漢字,包含常見中文

gbk 擴充套件了gb2312

gb18030 中文最全的

big5 正體中文

unicode 全世界字元編碼,2個位元組表示乙個字元,對英語國家來說,儲存檔案大,它是一種編碼方式

utf-8 是一種儲存格式,是unicode的一種實現

utf-8是邊長位元組,英語用1個位元組,漢語用3個位元組

bom(byte order mark)位元組序,windows的問題

字元編碼與解碼

ascii碼 英文本母 數字 特殊字元 擴充套件ascii碼 ascii碼的擴充套件,增加了拉丁文 gb2312 對ascii的中文擴充套件。簡體中文的字符集編碼。包含7000多漢字 gb18030和gbk gbk是對gb2312的擴充套件,包括了gb2312所有內容,增加近2萬漢字和符號 unic...

Java 字元編碼與解碼

1 字元編碼的發展歷程 ascii 碼 因為計算機只認識數字,所以我們在計算機裡面的一切資料都是以數字來表示,因為英文本元有限,所以規定使用的位元組的最高位是 0,每乙個位元組都是以 0 127 之間的數字來表示。比如 a 對應 65,a 對應 97。這便是 美國標準資訊交換碼,ascii stri...

is 編碼與解碼

is 和 主要是數字和字串的比較 1 區別 比較的是兩邊的值 is比較的是兩邊值的id id獲取的方法 id 2 小資料池 5 256 3 字串中特殊字元有id不同 4 字串中單個字元 20以內,記憶體位址是一樣的 21以上記憶體位址不一致 編碼與解碼 1 encode a 把明文編譯成a格式 de...