有關字元編碼的記錄

2021-08-01 22:41:31 字數 449 閱讀 3386

中國的unicode碼是4e2d56fd

gb2312碼是d6d0b9fa

以後遇到這種問題用中國兩個字試一下

public class testcharactorencoding 

system.out.println(s);

string(s.getbytes("iso8859-1"),"gb2312"));//如果得到的s是ios8859-1的字串,可以先編碼再以gb2312解碼,就能得到中文字元

//如果unicode的字串按iso8859-1編碼成位元組陣列,不能反向解碼成字串,因為「中」的unicode佔兩個位元組,按iso8859-1編碼只能生成乙個位元組,丟掉了一些資訊。

break;

default:

b[pos++] = (byte)ch;

}} }

}

常見字元編碼有關知識

unicode iso 國際標準化組織 為了解決不同語言之間進行文字轉換和處理,為每種語言設定統一的唯一的二進位制標準。簡稱ucs unicode只是規定如何編碼,並沒有規定如何傳輸和儲存編碼。utf 8及utf系列 相容全世界各種語言字元。utf 8英文只佔乙個位元組,漢字佔3個位元組。gb231...

有關XML的編碼問題

由於xml文件中可以包含外語字母,如挪威語 或法語 因此要讓你的xml分解器理解這些字母,就應該把xml文件儲存成unicode 統一的字元編碼標準 1 windows 95 98 記事本 windows 95 98 記事本不能將檔案儲存成unicode 格式。你可以用notepad 編輯和儲存包含...

記錄幾個有關LINUX IPTABLES的文章

基於 linux 平台的 libpcap 源 分析 過濾演算法 bpf 搜尋 algorithms for routing lookups and nf hipac演算法 linux netfilter實現機制和擴充套件技術 iptables規則集優化的設計與實現 netfilter包過濾演算法的分...