Python 輕量化簡繁轉換

2021-09-11 16:31:18 字數 1029 閱讀 1003

最近專案中用到了簡單的簡繁轉換,如果用opencc太重了,於是搜到了 zhconv 這個庫。

zhconv提供基於 mediawiki 詞彙表的最大正向匹配簡繁轉換,python 2, 3 通用。

支援以下地區詞轉換:

正好適合我不求轉換質量的輕量需求,所以介紹給更多需要的人。

而且雖然該專案stars很少,但中途發現作者還參與過維護jieba分詞。

呼叫也非常簡單

>>> from zhconv import convert

>>> convert('python是一種動態的、物件導向的指令碼語言', 'zh-hant')

'python是一種動態的、物件導向的指令碼語言'

複製**

支援對地區化詞語的轉換

>>> convert('計算機軟體', 'zh-tw')

'計算機軟體'

>>> convert('計算機軟體', 'zh-hans') # zh-hans只是逐字轉換

'計算機軟體'

>>> convert('計算機軟體', 'zh-cn')

'計算機軟體'

複製**

支援 mediawiki 人工轉換語法

>>> from zhconv import convert_for_mw

>>> s = '張國榮曾在英國--大學學習。'

>>> convert_for_mw(s, 'zh-hans')

'張國榮曾在英國利茲大學學習。'

>>> convert_for_mw(s, 'zh-hk')

'張國榮曾在英國列斯大學學習。'

>>> convert_for_mw(s, 'zh-tw')

'張國榮曾在英國里茲大學學習。'

複製**

當然對於複雜高精度的轉換需求,還是建議用專業的opencc開源庫:

Python 輕量化簡繁轉換

最近專案中用到了簡單的簡繁轉換,如果用opencc太重了,於是搜到了 zhconv 這個庫。zhconv提供基於 mediawiki 詞彙表的最大正向匹配簡繁轉換,python 2,3 通用。支援以下地區詞轉換 正好適合我不求轉換質量的輕量需求,所以介紹給更多需要的人。而且雖然該專案stars很少,...

簡繁轉換如此簡單

public function strconv byval str as string,byval conversion as microsoft.visualbasic.vbstrconv,optional byval localeid as integer 0 as string 成員屬於 mi...

HanLP極致簡繁轉換

談起簡繁轉換,許多人以為是小意思,按字轉換就行了。事實上,漢語歷史悠久,地域複雜,發展至今在字元級別存在 一簡對多繁 和 一繁對多簡 在詞語級別上存在 簡繁分歧詞 在港澳台等地則存在 字詞習慣不同 的情況。為此,hanlp新增了 簡體 繁體 台灣正體 香港繁體 間的相互轉換功能,力圖將簡繁轉換做到極...