字元編碼轉換

2021-05-18 01:13:52 字數 1402 閱讀 5080

這幾天在做個東西,就是關於網路字元編碼轉換的問題,此前這方面一點兒也不懂,頭要的急所以從快入手,先上網了解了一下字元編碼到底是什麼東西,於是知道了內碼轉換,gb2312,big5,unicode等東西,不懂的可以從網上搜搜,我也是搜的,建議大家先看看這個:http://www.vckbase.com/document/viewdoc/?id=1444寫的很好,我主要也是用人的**,做了點兒改動,以符合實際要求。

了解不是太深主要從實用入手,於是搜到乙個類可以在內碼間轉換。由於需要轉換的不是太多,只需要從:

big5->gb2312

utf_8->gb2312

這兩個編碼的轉換;

找到了網上的http://blog.csdn.net/mycro/archive/2005/12/06/544637.aspx這個,東西是個類,可以進行各種的相互轉換,我用不找其中的一些,所以做了剪短:

#include

using namespace std;

void big5togb2312(char *pcin,int nstrlen);

void utf_8togb2312(char *pcin,int nstrlen);

void unicodetogb2312(unsigned short udata,char* pout);   

//used  in

utf_8togb2312

void utf_8tounicode(char *ptext,wchar* pout);  

//used  in

utf_8togb2312

跟上面那個鏈結裡說的一樣,utf_8轉gb2312是利用下面的兩個函式進行乙個字乙個字的轉換,在win xp環境下vc 6。0裡面執行可用,經一天大容量txt文件測試,可用無記憶體洩露等問題(測試文件》10mb)。

//unicodetogb2312

void big5togb2312(char *pcin,int nstrlen) //[in][out] pcin,nstrlen為文件長度

else               

}memset(pcin,0,nstrlen);

memcpy(pcin,newbuf,nstrlen

//utf_8tounicode

void utf_8tounicode(char *ptext,wchar* pout)

//unicodetogb2312

void czaaaadlg::unicodetogb2312(unsigned short udata,char* pout)

呵呵,完了,算個念想,免得自己忘了

php字元編碼轉換

iconv convert string to requested character encoding php 4 4.0.5,php 5 mb convert encoding convert character encoding php 4 4.0.6,php 5 用法 string mb c...

字元編碼及其轉換

1.ascii 單字儲存 ascii碼使用單字儲存,即8位儲存,所以最多只能編碼256個字元,主要為西文服務。ascii碼劃分為兩個集合 128個字元的標準ascii碼和附加的128個字元的擴充ascii碼。2.ansi 單字儲存,也可以理解為單雙字混存 ansi是ascii字符集的擴充,在儲存as...

python字元編碼轉換

python 預設指令碼檔案都是 utf 8 編碼的,當檔案中有非 utf 8 編碼範圍內的字元的時候就要使用 編碼指示 來修正.關於 sys.defaultencoding,這個在解碼沒有明確指明解碼方式的時候使用。檔案編碼 python預設的編碼方式是unicode s 你好 轉換成utf 8編...