位、位元組、字元
位(bit):是計算機 內部資料 儲存的最小單位,11001100是乙個八位二進位制數。
位元組(byte):是計算機中 資料處理 的基本單位,習慣上用大寫 b 來表示,1b(byte,位元組)= 8bit(位)
字元:是指計算機中使用的字母、數字、字和符號
asciis碼(乙個ascii碼就是乙個位元組): 1個英文本母(不分大小寫)= 1個位元組的空間
1個中文漢字 = 2個位元組的空間
1個ascii碼 = 乙個位元組
utf-8編碼:1個英文本元 = 1個位元組
英文標點 = 1個位元組
1個中文(含繁體) = 3個位元組
中文標點 = 3個位元組
unicode編碼:1個英文本元 = 2個位元組
英文標點 = 2個位元組
1個中文(含繁體) = 2個位元組
中文標點 = 2個位元組
不同編碼格式中,位元組和字元的關係
ascii碼中 乙個英文本母 不分大小寫 佔乙個位元組的空間,乙個中文漢字佔兩個位元組的空間。乙個二進位制數字序列,在計算機中作為乙個數字單元,一般為8位二進位制數,換算為十進位制。最小值0,最大值255。utf 8編碼中 乙個英文本元等於乙個位元組,乙個中文 含繁體 等於三個位元組。unicode...
DB2 不同編碼格式下的漢字所佔位元組
utf 8 8 bit unicode transformation format 是一種針對unicode的可變長度字元編碼,又稱萬國碼,它包含全世界所有國家需要用到的字元,是國際編碼,通用性強,是用以解決國際上字元的一種多位元組編碼。由ken thompson於1992年建立。utf 8用1到4...
DB2 不同編碼格式下的漢字所佔位元組
utf 8 8 bit unicode transformation format 是一種針對unicode的可變長度字元編碼,又稱萬國碼,它包含全世界所有國家需要用到的字元,是國際編碼,通用性強,是用以解決國際上字元的一種多位元組編碼。由ken thompson於1992年建立。utf 8用1到4...