列印常見字符集的字元和對應的十進位制 二進位制編碼

2021-09-01 09:39:18 字數 1475 閱讀 3955

列印常見字符集( 'ascii', 'gb2312', 'gbk', 'utf-8','shift-jis' ) 的

十進位制--字元--二進位制對照表

(使用groovy批處理)

package li.kang.wang.charset

def charsets = [

'ascii', 'gb2312', 'gbk', 'utf-8','shift-jis'

] as string;

print("開始執行\n\n");

for(charset in charsets)

fileoutput.createnewfile();

begintime = system.currenttimemillis();

tempstr += "decimal \t-> char -> binary\n";

for(int i=0; i <= 20000;i++)

fileoutput.write(tempstr , charset);

println("***************=\t" + charset + "\t\t***************=");

println("消耗時間(秒):" + ( system.currenttimemillis() - begintime)/ 1000);

println "檔案大小(kb): " + (fileoutput.size()/1024);

}print("\n執行完畢");

console:

開始執行

***************= ascii ***************=

消耗時間(秒):92.651

檔案大小(kb): 640.810546875

***************= gb2312 ***************=

消耗時間(秒):56.251

檔案大小(kb): 641.404296875

***************= gbk ***************=

消耗時間(秒):54.602

檔案大小(kb): 641.5419921875

***************= utf-8 ***************=

消耗時間(秒):55.853

檔案大小(kb): 677.75

***************= shift-jis ***************=

消耗時間(秒):55.27

檔案大小(kb): 641.25

執行完畢

輸出檔案:

到19965後才有漢字編碼, 各種字符集對照:

1.ascii

2.gb2312

3.gbk

4.utf-8

5.sh

ift-jis

mysql常見字符集 MySQL字符集

一.字符集介紹 什麼是字符集 charset 字符集 是乙個系統支援的所有抽象字元的集合。字元是各種文字和符號的總稱,包括各國家文字 標點符號 圖形符號 數字等。1.gbk gb2312 gbk gb2312 採用雙位元組字符集,不論中 英文本元均使用雙字元來表示,為了區分中文,將其最高位都設定成1...

常見字符集和編碼方式

ascii unicode gbk gbk2312 utf 8這些字符集和編碼方式的名詞總是讓我們糾結,那麼他們有什麼區別呢?一般來講,除了utf 8是字符集unicode的編碼方式,其餘的例如ascii gbk等都屬於字符集,它們為每乙個字符集的字元都賦予了乙個值,這個值可以是乙個位元組大小 也可...

常見字符集 亂碼問題

常用字符集分類 ascii及其擴充套件字符集 作用 表語英語及西歐語言。位數 ascii是用7位表示的,能表示128個字元 其擴充套件使用8位表示,表示256個字元。範圍 ascii從00到7f,擴充套件從00到ff。iso 8859 1字符集 作用 擴充套件ascii,表示西歐 希臘語等。位數 8...