Python 簡繁體切換 zhconv

2021-10-12 17:16:56 字數 1187 閱讀 4725

pip install zhconv
zhconv 提供基於 mediawiki 詞彙表的最大正向匹配簡繁轉換。python 2, 3 通用。支援以下地區詞轉換:

zh-cn 大陸簡體

zh-tw 台灣正體

zh-hk 香港繁體

zh-sg 馬新簡體

zh-hans 簡體

zh-hant 繁體

正好適合我不求轉換質量的輕量需求,所以介紹給更多需要的人。

而且雖然該專案stars很少,但中途發現作者還參與過維護jieba分詞。

呼叫也非常簡單

>>

>

from zhconv import convert

>>

> convert(

'python是一種動態的、物件導向的指令碼語言'

,'zh-hant'

)'python是一種動態的、物件導向的指令碼語言'

支援對地區化詞語的轉換

>>

> convert(

'計算機軟體'

,'zh-tw'

)'計算機軟體'

>>

> convert(

'計算機軟體'

,'zh-hans'

)# zh-hans只是逐字轉換

'計算機軟體'

>>

> convert(

'計算機軟體'

,'zh-cn'

)'計算機軟體'

支援 mediawiki 人工轉換語法

>>

>

from zhconv import convert_for_mw

>>

> s =

'張國榮曾在英國--大學學習。'

>>

> convert_for_mw(s,

'zh-hans'

)'張國榮曾在英國利茲大學學習。'

>>

> convert_for_mw(s,

'zh-hk'

)'張國榮曾在英國列斯大學學習。'

>>

> convert_for_mw(s,

'zh-tw'

)'張國榮曾在英國里茲大學學習。'

簡繁體轉換

這篇文章的題目應該叫中文 中國大陸 中文 中國台灣 字符集的轉換。因為如果僅僅是簡繁體的轉換,那麼友好多的文章都叫你去呼叫microsoft.visualbasic.strings.strconv,殊不知,他只是把中文 中國大陸 中的簡體字轉換成了中文 中國大陸 中的繁體字,這是治標不治本的做法。下...

Python實現簡繁體轉換

如今,世界上存在兩種中文,一種是中文簡體,一種是中文繁體。如果要完全掌握中文語言的自然語言處理,那麼簡繁都不可避免。所以,掌握了簡體與繁體的轉換,往往能夠事半功倍。而hanlp也提供了簡繁轉換的類 chartable,用它來執行字元正規化。比如簡體轉換繁體,全形轉換半形,大寫轉換小寫,都可以使用該類...

php簡繁體轉換

實現簡體轉繁體,繁體到轉體 2007 12 27 16 34 function gb2big5 text else text i gb 0 text i 1 gb 1 i fclose fp return text 簡體轉繁體 end 繁體轉簡體 start function big52gb tex...