python 提取漢字首字母

2021-09-24 02:59:36 字數 1158 閱讀 3132

使用拼音庫xpinyin

import xpinyin

if __name__ ==

'__main__'

: p = xpinyin.pinyin(

) result =

[p.get_initials(a,'')

for a in

['上海'

,'武漢'

,'深圳']]

print

(result)

>>> from xpinyin import pinyin

>>> p = pinyin()

>>> # default splitter is `-`

>>> p.get_pinyin(u"上海")

'shang-hai'

>>> # show tone marks

>>> p.get_pinyin(u"上海", tone_marks='marks')

'shàng-hǎi'

>>> p.get_pinyin(u"上海", tone_marks='numbers')

>>> 'shang4-hai3'

>>> # remove splitter

>>> p.get_pinyin(u"上海", '')

'shanghai'

>>> # set splitter as whitespace

>>> p.get_pinyin(u"上海", ' ')

'shang hai'

>>> p.get_initial(u"上")

's'>>> p.get_initials(u"上海")

's-h'

>>> p.get_initials(u"上海", u'')

'sh'

>>> p.get_initials(u"上海", u' ')

's h'

如果方法中傳入變數,那麼直接加字首是不可以了。而是要將變數轉為utf-8編碼:

>>> wordvalue = '中國'

>>> wordvalue= unicode(wordvalue,'utf-8')

>>> s = p.get_initials(wordvalue, u'').lower()

'zg'

提取漢字首字母

using system using system.collections.generic using system.text namespace stringoption return mystr 把提取的字母變成大寫 需要轉換的字串 轉換結果 public static string getlo...

提取漢字首字母工具類

public class stringutil 存放國標一級漢字不同讀音的起始區位碼對應讀音 static final char firstletter 獲取乙個漢字的拼音首字母。gb碼兩個位元組分別減去160,轉換成10進製碼組合就可以得到區位碼 例如漢字 你 的gb碼是0xc4 0xe3,分別減...

漢字首字母

在很多軟體中,輸入拼音的首寫字母就可以快速定位到某個詞條。比如,在鐵路售票軟體中,輸入 bj 就可以定位到 北京 怎樣在自己的軟體中實現這個功能呢?問題的關鍵在於 對每個漢字必須能計算出它的拼音首字母。gb2312漢字編碼方式中,一級漢字的3755個是按照拼音順序排列的。我們可以利用這個特徵,對常用...