有關字元編碼的記錄

中國的unicode碼是4e2d56fd

gb2312碼是d6d0b9fa

以後遇到這種問題用中國兩個字試一下

public class testcharactorencoding 
system.out.println(s);
string(s.getbytes("iso8859-1"),"gb2312"));//如果得到的s是ios8859-1的字串，可以先編碼再以gb2312解碼，就能得到中文字元
//如果unicode的字串按iso8859-1編碼成位元組陣列，不能反向解碼成字串，因為「中」的unicode佔兩個位元組，按iso8859-1編碼只能生成乙個位元組，丟掉了一些資訊。
break;
default:
b[pos++] = (byte)ch;
}} }
}

常見字元編碼有關知識

unicode iso 國際標準化組織為了解決不同語言之間進行文字轉換和處理，為每種語言設定統一的唯一的二進位制標準。簡稱ucs unicode只是規定如何編碼，並沒有規定如何傳輸和儲存編碼。utf 8及utf系列相容全世界各種語言字元。utf 8英文只佔乙個位元組，漢字佔3個位元組。gb231...

有關XML的編碼問題

由於xml文件中可以包含外語字母，如挪威語或法語因此要讓你的xml分解器理解這些字母，就應該把xml文件儲存成unicode 統一的字元編碼標準 1 windows 95 98 記事本 windows 95 98 記事本不能將檔案儲存成unicode 格式。你可以用notepad 編輯和儲存包含...

記錄幾個有關LINUX IPTABLES的文章

基於 linux 平台的 libpcap 源分析過濾演算法 bpf 搜尋 algorithms for routing lookups and nf hipac演算法 linux netfilter實現機制和擴充套件技術 iptables規則集優化的設計與實現 netfilter包過濾演算法的分...

有關字元編碼的記錄

常見字元編碼有關知識

有關XML的編碼問題

記錄幾個有關LINUX IPTABLES的文章

相關推薦