String解碼和byte 編碼實踐

2021-07-27 02:32:36 字數 841 閱讀 5666

本機預設使用字符集,可以使用chcp命令檢視:

活動**頁936表示字符集為gb2312。

前面已經詳細講述了位元組編碼和字元解碼,下面看具體例子:

測試����

測試測試

??utf-8

string str2 = new string(str.getbytes(「utf-8」)); 預設使用檔案的編碼進行解碼。

string str3 = new string(str.getbytes(「gbk」));使用gbk將其轉換為位元組,再使用預設編碼方式進行解碼。

string str4 = new string(str.getbytes(「utf-8」),「utf-8」);

都可以正確解析!

string str5 = new string(str.getbytes(「gbk」),「gbk」);

可正確解析。

string str6 = new string(str.getbytes(「iso-8859-1」),「iso-8859-1」);

不可正確解析,因為iso-8859-1不支援中文。

java 中String編碼和byte 解碼 總結

1 inputstreamreader 是位元組流通向字元流的橋梁 它使用指定的 charset 讀取位元組並將其解碼為字元 inputstreamreader inputstream in,string charsetname 2 outputstreamwriter 是字元流通向位元組流的橋梁 ...

編碼和解碼

str是以位元組表示的文字,unicode是以字元表示的文字。您可以將文字從位元組解碼為unicode,並使用某種編碼將unicode編碼為位元組。即 str str unicode str encode 編碼,程式設計不可識別的unicode decode 解碼,恢復成字串和中文等def test...

編碼和解碼

1 編碼 encode 編碼方式 拿到明文編碼後對應的位元組 ascii 碼 不支援中文,支援英文 數字 字母 符號 gbk 國標 支援中文 支援英文 數字 字母 符號 英文用16位 中文用16位 unicode 萬國碼 支中文 英文 數字 字母 英文32位 中文32位 utf 8 長度可變的萬國碼...