Java習作 提取漢字拼音首字母(Java版)

2021-09-22 03:47:26 字數 1092 閱讀 2762

package info.gnuhpc;

/** * @author gnuhpc email: [email protected] blog:

* @date 2010-1-22

* @bugs 不支援多音字處理

*/public class pinyinconv ;

// 二十六個字母區間對應二十七個端點

// gb2312碼漢字區間十進位制表示

private static int table = new int[27];

// 對應首字母區間表

private static char initialtable = ;

// 初始化

static

table[26] = end;// 區間表結尾

}// ------------------------public方法區------------------------

/*** 根據乙個包含漢字的字串返回乙個漢字拼音首字母的字串 最重要的乙個方法,思路如下:乙個個字元讀入、判斷、輸出

*/public static string cn2py(string sourcestr)

} catch (exception e)

return result;

}// ------------------------private方法區------------------------

/*** 輸入字元,得到他的聲母,英文本母返回對應的大寫字母,其他非簡體漢字返回 '0'

* */

private static char char2initial(char ch)

if (gb==end)

return initialtable[i]; // 在碼表區間中,返回首字母

}/**

* 取出漢字的編碼 cn 漢字

*/private static int gbvalue(char ch) catch (exception e)

}public static void main(string args) throws exception

}

提取漢字拼音的首字母

這個能取大部分漢字的首字母,但還不全,有些unicode的漢字是取不到的,要想取到所有漢字的首字母,最好是能做乙個unicode漢字和拼音的對照表,通過對照表查.gb2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個 同時,gb2312收錄了包括拉丁字母 希臘字母 日文平假...

提取漢字拼音的首字母

這個能取大部分漢字的首字母,但還不全,有些unicode的漢字是取不到的,要想取到所有漢字的首字母,最好是能做乙個unicode漢字和拼音的對照表,通過對照表查.gb2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個 同時,gb2312收錄了包括拉丁字母 希臘字母 日文平假...

漢字提取拼音首字母修正

using system using system.collections.generic using system.linq using system.text namespace getcnspell return mystr 把提取的字母變成小寫 需要轉換的字串 轉換結果 public str...