全形半形的相互轉換問題

2022-07-13 13:21:14 字數 1047 閱讀 2150

首先了解全形半形的關係:

1.半形字元是從33開始到126結束

2.與半形字元對應的全形字符是從65281開始到65374結束

3.其中半形的空格是32.對應的全形空格是12288

半形和全形的關係很明顯,除空格外的字元偏移量是65248(65281-33 = 65248)

// 第一種轉換方式:

/*** 全形字串轉換半形字串

* * @param fullwidthstr

*            非空的全形字串

* @return 半形字串

*/private static string fullwidth2halfwidth(string fullwidthstr)

char chararray = fullwidthstr.tochararray();

//對全形字符轉換的char陣列遍歷

for (int i = 0; i < chararray.length; ++i) else if (charintvalue == 12288)

}return new string(chararray);

}// 第二種轉換方式

/**

* 半形轉全形

* @param input string.

* @return 全形字串.

*/public static string tosbc(string input) else if (c[i] < '\177')

}return new string(c);

}/**

* 全形轉半形

* @param input string.

* @return 半形字串

*/public static string todbc(string input) else if (c[i] > '\uff00' && c[i] < '\uff5f')

}string returnstring = new string(c);

return returnstring;

}

半形全形相互轉換

全形空格為12288,半形空格為32 其他字元半形 33 126 與全形 65281 65374 的對應關係是 均相差65248 code 全形空格為12288,半形空格為32 其他字元半形 33 126 與全形 65281 65374 的對應關係是 均相差65248 半形轉換為全形函式 funct...

半形與全形的相互轉換

1 2 轉全形的函式 sbc case 3 4 任意字串 5 全形字串 6 7 全形空格為12288,半形空格為32 8 其他字元半形 33 126 與全形 65281 65374 的對應關係是 均相差65248 9 10public static string tosbc string input...

python實現全形半形的相互轉換

緣起 在自然語言處理過程中,全形 半形的的不一致會導致資訊抽取不一致,因此需要統一。轉換說明 全形半形轉換說明 有規律 不含空格 全形字符unicode編碼從65281 65374 十六進製制 0xff01 0xff5e 半形字元unicode編碼從33 126 十六進製制 0x21 0x7e 特例...