Python使用Opencc庫完成字元繁簡體轉換

2021-07-31 21:33:19 字數 851 閱讀 9528

在日常工作中,我們常常會遇到轉換中文字元繁簡體的情況。接下來,我該大家介紹乙個很強大的python庫,用來方便的處理字元轉換。
opencc(open chinese convert)是乙個開源的中文繁簡體轉換專案,作者是目前任職於google的byvoid。詳細資訊請看官網(
opencc支援mac、linux、windows平台安裝,由於我的電腦是windows系統,下面只介紹windows下的安裝:
解壓縮這個安裝包,把裡面的distribute_setup.py檔案放到你的python的lib目錄中去,如果你不知道lib目錄是什麼,可以用下述方法大概檢視一下:

in: import sys

in: sys.path

out:#你的python目錄

我把它放入了』c:\anaconda\lib』中。

然後開啟cmd,鍵入pip install opencc-python,就可以使用了

from opencc import opencc

#繁轉簡

c = opencc('t2s')

#設定測試資料

data = u'open chinese convert(opencc)是乙個開源的中文簡繁轉換專案,致力於製作高質量的基於統計預料的簡繁轉換詞庫。還提供函式庫(libopencc)、命令列簡繁轉換工具、人工校對工具、詞典生成程式、線上轉換服務及圖形使用者介面'

data_new = c.convert(data)

print data_new

下面是輸出結果

windows使用opencc中文簡體和繁體互轉

opencc git專案位址 opencc是一款開源的中文處理工具,支援字元級別的轉換,可以在中文簡體和繁體以及香港 台灣之間相互轉換。git上提供了在debian ubuntu fedora arch linux mac os以及node.js的安裝方法,並沒有提供在windows上面的安裝。這篇...

python 庫的使用

1.configparser 用來載入配置。載入的配置檔案中 modelname 為模組名,下面是用 向鏈結的key value對,如 database connection database name pgsql database password 123456 之後用cls.database n...

python庫numpy的使用

python在構造機器學習應用程式時,numpy作為乙個重要的函式庫會被經常使用,裡面有便捷的向量和矩陣的計算函式 from numpy import 構造4 4的隨機矩陣 matrix mat random.rand 4,4 矩陣逆矩陣 invmat matrix.i 單位矩陣 matrix ma...