python簡体字中国語から繁体字中国語への変換を実現

2766 ワード

最近の仕事の上の1つの任務はクライアントの言語を簡体字中国語と英語の基礎の上で更に繁体字中国語を増加することで、同僚はpythonのライブラリを推薦して、名前はzhconvと言って、このライブラリの利点はテキストの中で簡体字中国語の部分を繁体字中国語に翻訳することができて、例えば、ソフトウェア簡体字中国語の翻訳ファイルはjsonフォーマットです.このライブラリを使用して、繁体字中国語のjosn形式の翻訳ファイルを生成することができます.
このライブラリpython 2、3のバージョンはサポートされています. 
まずzhconvをインストールします
pip install zhconv


コマンドライン実装
    python -mzhconv [-w] {zh-cn|zh-tw|zh-hk|zh-sg|zh-hans|zh-hant|zh} < input > output

注意:python 2はこのコマンドラインを使用するとよくサポートされることがわかりますが、python 3はできません.入力ファイルの符号化と関係があります.元のファイルの符号化はutf-8でなければなりません.したがって、pythonのウィジェットを以下のように書き、ライブラリを導入することで翻訳を実現することができます.
コード実装
テストファイルzh_test.json
{
    "   ":[
        "            ",
        "            ",
        "            ",
        "          "
    ]
}

プログラム出力ファイルzhtw_test.json
{
        "   ":[
                "            ",
                "            ",
                "            ",
                "          "
        ]
}

変換を実現するコード
import zhconv
import sys
import os

def convertToZhtw(inputTsPath, outTsPath):
    with open(inputTsPath,'r', encoding='UTF-8') as f:
        content = f.read()
        with open(outTsPath,'w',encoding='UTF-8') as f1:
            f1.write(zhconv.convert(content, 'zh-tw'))

convertToZhtw('zh_test.json', 'zhtw_test.json')