C 判斷中文字元

2021-04-18 09:34:28 字數 1758 閱讀 1502

方法一:在unicode 字串中,中文的範圍是在4e00..9fff:cjk unified ideographs。 通過對字元的unicode編碼進行判斷來確定字元是否為中文。 程式**

protected bool   ischineseletter(string input,int index)

else

}return false;

}

方法二:程式**

public bool ischina(string cstring)

else

}return boolvalue;

}

方法三:程式**      

/// /// 判斷句子中是否含有中文

///

/// 字串

public bool wordsiscn(string words)

}return false;

}

方法四:程式**
for (int i=0; i

/u4e00-/u9fa5 漢字的範圍。 ^[/u4e00-/u9fa5]$ 漢字的範圍的正則

同理可以判斷日文: /u0x3040-/u0x309f 是平假名, /u0x30a0-/u0x30ff 是片假名

方法五:程式**

unicodeencoding unicodeencoding = new unicodeencoding();

byte unicodebytearray = unicodeencoding.getbytes( inputstring );

for( int i = 0; i < unicodebytearray.length; i++ )

……

方法六:程式**

/// /// 給定乙個字串,判斷其是否只包含有漢字

///

///

///

public bool isonlycontainschinese(string teststr)

else

}return true;

}/// /// 判斷乙個word是否為gb2312編碼的漢字

///

///

///

private bool isgbcode(string word)

else

else}}

/// /// 判斷乙個word是否為gbk編碼的漢字

///

///

///

private bool isgbkcode(string word)

else

else}}

/// /// 判斷乙個word是否為big5編碼的漢字

///

///

///

private bool isbig5code(string word)

else

else

}}

C 輸出中文字元

1.cout 場景1 在原始檔中定義 const char str 中文 在 vc 編譯器上,由於windows環境用 gbk編碼,所以字串 中文 被儲存為 gbk內碼,編譯器也把 str 指向乙個包含有 gbk編碼的唯讀記憶體空間.用 cout 輸出 str 時,由於中文windows環境用gbk...

C 中文字元處理

解決方案 構造三層邏輯結構 輸入層 邏輯處理層 輸出層。輸入層接收char輸入,並將其轉換為wchar.邏輯處理層在 wchar 或 wstring 的基礎上進行字串操作,此時操作最小單位為中文字元,不會再有亂碼。輸出層將wchar的結果再次轉換為char 返回給外部。這樣,對外部來說,仍然是輸入c...

C 判斷中文字元(字串)

it168技術文件 在unicode 字串中,中文的範圍是在4e00.9fff cjk unified ideographs。通過對字元的unicode編碼進行判斷來確定字元是否為中文。protected bool ischineseletter string input,intindex else...