漢字的位元組計算情況不同

2022-09-16 20:27:17 字數 545 閱讀 5148

string name="宋";

int a=name.getbytes("gb2312").length;

system.out.println(a);//a=2

a=name.getbytes("utf-8").length;//乙個漢字佔3個位元組

system.out.println(a);//a=3

a=name.getbytes("gbk").length;

system.out.println(a);//a=2

a=name.getbytes("iso8859-1").length;//乙個漢字佔乙個位元組

system.out.println(a);//a=1

a=name.length();//乙個漢字佔乙個長度

system.out.println(a);//a=1

a=name.getbytes("unicode").length;//乙個漢字佔乙個位元組

system.out.println(a);//a=4

j**a的預設編碼是unicode吧,應該是4個位元組啊

DB2 不同編碼格式下的漢字所佔位元組

utf 8 8 bit unicode transformation format 是一種針對unicode的可變長度字元編碼,又稱萬國碼,它包含全世界所有國家需要用到的字元,是國際編碼,通用性強,是用以解決國際上字元的一種多位元組編碼。由ken thompson於1992年建立。utf 8用1到4...

DB2 不同編碼格式下的漢字所佔位元組

utf 8 8 bit unicode transformation format 是一種針對unicode的可變長度字元編碼,又稱萬國碼,它包含全世界所有國家需要用到的字元,是國際編碼,通用性強,是用以解決國際上字元的一種多位元組編碼。由ken thompson於1992年建立。utf 8用1到4...

bit byte 位 位元組 漢字的關係

bit byte 位 位元組 漢字的關係 1 bit 1 二進位制資料 1 byte 8 bit 1 字母 1 byte 8 bit 1 漢字 2 byte 16 bit 4.乙個漢字佔2個位元組 1 漢字 2 byte 16 bit 5.標點符號 a 漢字輸入狀態下,預設為全形輸入方式 b 英文輸...