Linux下Gb2312與UTF 8的轉換

2021-05-27 08:38:40 字數 690 閱讀 4084

轉換函式:

static int u2s( char *t, int size, char *p_tmp )

while(a != t[0] || b != t[1]);

fclose(fp);

fp = fopen("/res/gb_table11.c", "r");

if(fp == null)

return false;

fseek(fp, 2 * (i - 1), seek_set);

p_tmp[0] = fgetc(fp);

p_tmp[1] = fgetc(fp);

fclose(fp);

return true;

}static int utf8_2_gb2312(char *p)

else if ( 0xc0 == ( *s & 0xe0 ) &&

0x80 == ( *( s + 1 ) & 0xc0 ) )

else

} while ( i < len );

*p_tmp = 0;

memset(p, 0, sizeof(p));

strcpy(p, d);

//free(s);

//free(d);

return true;

}其中un_table11.c和gb_table11.c是想對應的2個碼表。

gb2312學習筆記

1,gb 2312中對所收漢字進行了 分割槽 處理,每區含有94個漢字 符號。01 09區為特殊符號。16 55區為一級漢字,按拼音排序。56 87區為二級漢字,按部首 筆畫排序。10 15區及88 94區則未有編碼。舉例來說,啊 字是gb2312之中的第乙個漢字,它的區位碼就是1601。2,在使用...

GB2312編碼範圍

gb2312編碼範圍 a1a1 fefe,其中漢字編碼範圍 b0a1 f7fe。gb2312編碼是第乙個漢字編碼國家標準,由中國國家標準總局1980年發布,1981年5月1日開始使用。gb2312編碼共收錄漢字6763個,其中一級漢字3755個,二級漢字3008個。同時,gb2312編碼收錄了包括拉...

終端VI支援gb2312

修改.vimrc檔案,讓其支援 gb2312就行 設定檔案編碼型別,徹底解決中文編碼問題 let termencoding encoding set fileencodings utf 8,gbk,ucs bom,cp936 略微查了一下.vimrc中新增內容的含意,這篇文章有相關解釋。內容如下 v...