VC 中多位元組字符集和Unicode之間的互換

2022-02-02 03:25:52 字數 2359 閱讀 6450

在visual c++.net中,預設的字符集是unicode,這和windows預設的字符集是一致的,不過在老的vc6.0等工程中,預設的字符集形式是多位元組字符集(mbcs:multi-byte character set),這樣導致在vc6.0中非常簡單實用的各類字元操作和函式在vs2005環境下執行時會報各種各樣的錯誤,這裡總結了在visual c++.net2005環境中unicode字符集下cstring和char *之間相互轉換的幾種方法,其實也就是unicode字符集與mbcs字符集轉換。

1.unicode下cstring轉換為char *

方法一: 使用api:widechartomultibyte進行轉換

cstring str = _t(

"你好,世界!hello,world");

//注意:以下n和len的值大小不同,n是按字元計算的,len是按位元組計算的

int n = str.getlength()

;//獲取寬位元組字元的大小,大小是按位元組計算的

int len = widechartomultibyte(cp_acp,0,str,str.getlength()

,null,0,null,null)

;//為多位元組字元陣列申請空間,陣列大小為按位元組計算的寬位元組位元組大小

char

* pfilename = new char

[len+1]

;//以位元組為單位

//寬位元組編碼轉換成多位元組編碼

widechartomultibyte(cp_acp,0,str,str.getlength()

,pfilename,len,null,null)

;pfilename[len+1]

=『\0『

;//多位元組字元以』\0′結束

方法二:使用函式:t2a、w2a

cstring str = _t(

"你好,世界!hello,world");

//宣告識別符號

uses_conversion;

//呼叫函式,t2a和w2a均支援atl和mfc中的字元轉換

char

* pfilename = t2a(str)

;//char * pfilename = w2a(str); //也可實現轉換

注意:有時候可能還需要新增引用#include

2、unicode下char *轉換為cstring

方法一:使用api:multibytetowidechar進行轉換

char

* pfilename =

"你好,世界!hello,world"

;//計算char *陣列大小,以位元組為單位,乙個漢字佔兩個位元組

int charlen = strlen(pfilename)

;//計算多位元組字元的大小,按字元計算。

int len = multibytetowidechar(cp_acp,0,pfilename,charlen,null,0)

;//為寬位元組字元陣列申請空間,陣列大小為按位元組計算的多位元組字元大小

tchar *buf = new tchar[len + 1]

;//多位元組編碼轉換成寬位元組編碼

multibytetowidechar(cp_acp,0,pfilename,charlen,buf,len)

;buf[len]

=『\0『

;//新增字串結尾,注意不是len+1

//將tchar陣列轉換為cstring

cstring pwidechar;

(buf)

;//刪除緩衝區

delete [

]buf;

方法二:使用函式:a2t、a2w

char

* pfilename =

"你好,世界!hello,world"

;uses_conversion;

cstring s = a2t(pfilename)

;//cstring s = a2w(pfilename);

方法三:使用_t巨集,將字串轉換為寬字元

//多位元組字符集,在vc6和vc7種可以編譯通過的語句,但vs2005不能通過,預設為unicode字符集

//afxmessagebox("載入資料失敗",0);

//書寫**使用text("")或_t(""),文字在unicode和非unicode程式裡都通用

afxmessagebox(_t(

"載入資料失敗"

),0)

;注意:直接轉換在基於mbcs的工程可以,但在基於unicode字符集的工程中直接轉換是不可行的,cstring會以unicode的形式來儲存資料,強制型別轉換只會返回第乙個字元。

寬位元組字符集和多字符集

unicode 寬位元組字符集 1.如何取得乙個既包含單位元組字元又包含雙位元組字元的字串的字元個數?可以呼叫microsoft visual c 的執行期庫包含函式 mbslen來操作多位元組 既包括單位元組也包括雙位元組 字串。呼叫strlen函式,無法真正了解字串中究竟有多少字元,它只能告訴你...

多位元組字符集和寬位元組字符集區別

多位元組字符集 字元編碼可能是1個位元組 也可能是2個位元組 ascii碼占用1個位元組儲存 中文 unicode 等 占用2個位元組 it學吧 16進製制編碼 73 84 47 89 80 55 0 16進製制最高位為1 代表負數 當存在負數則會把兩個負數當做乙個中文字元 73 i 1位元組 84...

單位元組字符集,多位元組字符集,Unicode

我們在這裡介紹一下字元型別。這裡有3種編碼模式對應3種字元型別。第一種編碼型別是單子節字符集 single byte character set or sbcs 在這種編碼模式下,所有的字元都只用乙個位元組表示。ascii是sbcs。乙個位元組表示的0用來標誌sbcs字串的結束。第二種編碼模式是多位...