不同編碼下字母跟位元組的對應關係

2021-09-07 18:06:17 字數 506 閱讀 4462

位、位元組、字元

位(bit):是計算機 內部資料 儲存的最小單位,11001100是乙個八位二進位制數。

位元組(byte):是計算機中 資料處理 的基本單位,習慣上用大寫 b 來表示,1b(byte,位元組)= 8bit(位)

字元:是指計算機中使用的字母、數字、字和符號

asciis碼(乙個ascii碼就是乙個位元組): 1個英文本母(不分大小寫)= 1個位元組的空間

1個中文漢字 = 2個位元組的空間

1個ascii碼 = 乙個位元組

utf-8編碼:1個英文本元 = 1個位元組

英文標點  = 1個位元組

1個中文(含繁體) = 3個位元組

中文標點 = 3個位元組

unicode編碼:1個英文本元 = 2個位元組

英文標點  = 2個位元組

1個中文(含繁體) = 2個位元組

中文標點 = 2個位元組

不同編碼格式中,位元組和字元的關係

ascii碼中 乙個英文本母 不分大小寫 佔乙個位元組的空間,乙個中文漢字佔兩個位元組的空間。乙個二進位制數字序列,在計算機中作為乙個數字單元,一般為8位二進位制數,換算為十進位制。最小值0,最大值255。utf 8編碼中 乙個英文本元等於乙個位元組,乙個中文 含繁體 等於三個位元組。unicode...

DB2 不同編碼格式下的漢字所佔位元組

utf 8 8 bit unicode transformation format 是一種針對unicode的可變長度字元編碼,又稱萬國碼,它包含全世界所有國家需要用到的字元,是國際編碼,通用性強,是用以解決國際上字元的一種多位元組編碼。由ken thompson於1992年建立。utf 8用1到4...

DB2 不同編碼格式下的漢字所佔位元組

utf 8 8 bit unicode transformation format 是一種針對unicode的可變長度字元編碼,又稱萬國碼,它包含全世界所有國家需要用到的字元,是國際編碼,通用性強,是用以解決國際上字元的一種多位元組編碼。由ken thompson於1992年建立。utf 8用1到4...