繁體與簡體互相轉換

2021-08-21 07:20:08 字數 1261 閱讀 9609

繁體與簡體的轉換,目前常用的工具包是opencc。

通過上網搜尋與研究測試。目前有兩種方式進行轉換,一種是python呼叫opencc的形式,一種是linux內直接命令列操作。

通過兩種方式的測評,python下執行速度極慢,linux下轉換速度相當快。

一、linux安裝與使用:

二、windows中python下安裝使用:

修改檔案:python36\lib\site-packages\opencc\__init__.py(該路徑根據自己實際情況而定)

也就是將from version那一句注釋掉,增加version的預設值設定。

#from version import __version__

__version__ = '0.1'

呼叫示例:

# -*- coding: utf8 -*-

import opencc

import codecs

def write_txt(file_name, line):

with codecs.open(file_name, 'a', encoding='utf-8') as f:

f.write(line)

if __name__ == '__main__':

# cc = opencc.opencc('t2s')

# print(cc.convert(u'open chinese convert(opencc)「開放中文轉換」,是乙個致力於中文簡繁轉換的專案,提供高質量詞庫和函式庫(libopencc)。'))

old_file = '../doc/as_testing_gold.utf8'

cc = opencc.opencc('t2s')

with codecs.open(old_file, mode='r', encoding='utf-8') as f:

with codecs.open('../doc/as_testing_gold_cn.txt', mode='w', encoding='utf-8') as out:

lines = f.readlines()

count = 0

for line in lines:

# print(cc.convert(line))

count += 1

if count % 1000 == 0:

print(count)

out.write(cc.convert(line))

簡體轉換繁體

vb.net strconv 函式介紹 public shared function strconv byval str as string,byval conversion as microsoft.visualbasic.vbstrconv,optional byval localeid as ...

C 簡體繁體轉換

簡體轉繁體 轉換內容 繁體 public static string convertbig5 string convertext 繁體轉簡體 轉換內容 簡體 public static string convertgb2312 string convertext 將繁體亂碼轉繁體 已經是big5編碼...

中文簡體與繁體的轉換

雖然說中文繁體與簡體的轉換在專案中使用到的概念很小,但是這也算是乙個有工具類了,為了以後可能的需要,在這裡說一下 package com.iflytek.zjfconverter import com.spreada.utils.chinese.zhconverter author xudongwa...