C 文字編碼轉換

2021-08-15 06:33:32 字數 758 閱讀 1433

1.  c#的編碼轉換預設由system.text.encoding進行操控轉換.

引用為:

using system.text;
2.  c# encoding類自帶編碼有:utf7/utf8/utf32/unicode/ascii,

encoding類有乙個子類就是default,此類會隨操作環境變化而變化,

在windows平台上編碼為"gb18030" (gbk為此編碼子集).

在其他作業系統上可能會是"utf-8".所以為了跨平台編碼正確,請謹慎使用default.

而encodin類獲取其他編碼方式為:

encoding.getencoding(int codepage);
如:

encoding.getencoding("gbk"); 等同於encoding.getencoding(936);
tip:codepage可在getencoding後用類

.codepage

獲取.

3.  unicode編碼轉換:

encoding.convert(encoding.unicode,encoding.getencoding("gb18030"),byte);
文字unicode編碼轉換,例如\u4f60,\u代表unicode編碼,4f60代表 60 4f 位元組,用unicode編碼轉換,

即可得到"你".

C 編碼轉換

最近在c 專案中經常會遇到編碼轉換問題,例如ascii碼,utf 8,多位元組等等,特此總結下來並附上 也方便大家學習和使用。include enum u78 typedef unsigned short utf16 16 bits typedef unsigned char utf8 8 bits...

PHP文字格式編碼轉換

text是用fread,fgets等函式讀取到的文字內容,因為格式可能為gbk,而php顯示是utf8,所以會亂碼,用下面 判斷 text編碼格式並轉成utf8,這樣輸出就不會有亂碼了 text file get contents filepath encodtype mb detect encod...

Ubuntu設定中文編碼和文字的編碼轉換

ubuntu 預設採用utf8編碼,但訪問部分win文字檔案時,出現亂碼。執行 sudo vi var lib locales supported.d zh hans 加入以下配置引數 zh cn.gb18030 gb18030 最新漢字編碼字符集,向下相容gbk,gb2312 zh cn.gbk ...