Python漢字変換ピンインライブラリpypinyin

2220 ワード

一、初心:
一部のオープンソースソフトウェアのコンフィギュレーションファイルの中で区別を識別する部分は英語で、コンフィギュレーションファイルを一括生成する際にCMDBから漢字(idc_name)をインポートすることができます.
その後、ピンインに変換したり、IPアドレスをつなぎ合わせたりして、より正確に識別します.たとえば、SmokepingのTargetsプロファイルは次のようになります.
+telcom
menu =     
title = telcom

++yunfuxinxingshuangxian-01-61
menu =       -01
title = 61.11.11.11
host = 61.11.11.11

 
二、方法:
Pythonのpypinyinライブラリを呼び出して、漢字がピンインに変わる問題を解決することができます.
>>> import pypinyin >>> from pypinyin import pinyin, lazy_pinyin >>> lazy_pinyin(u'      -01') [u'yun', u'fu', u'xin', u'xing', u'shuang', u'xian', u'-01'] >>> ''.join(lazy_pinyin(u'      -01')) u'yunfuxinxingshuangxian-01'
>>> ''.join(lazy_pinyin(u'      -01'))+'-'+'61.11.11.11'.split('.')[0] u'yunfuxinxingshuangxian-01-61'

 
また、漢字をピンインに変換してプロファイルに書き込むには、ピンインを漢字に変換してレポートなどを表示する必要があるかもしれません.
では、プロファイルを読み取り、対応するmenu(漢字部分)を取ることができます.ここでは、実際のニーズを具体的に見るための解決策を提供します.
grep -n1 yunfuxinxingshuangxian /etc/smokeping/config.d/Targets |grep menu|awk '{print $NF}

 
付:漢字ピンイン変換ツール(Python版)公式サイト:http://pypinyin.readthedocs.org/en/master/