自然言語処理(NLP)-哈工大pyltpのインストールと使用チュートリアル
6217 ワード
哈工大言語技術プラットフォーム(Language Technology Platform,LTP)はハルビン工業大学社会計算と情報検索研究センターが開発した中国語言語処理システムである.LTPはまた、中国語分詞、品詞表記、ネーミングエンティティ識別、依存構文解析、意味役割表記などNLP技術を提供している.
哈工大言語クラウドプレゼンテーションプラットフォーム:http://www.ltp-cloud.com/GitHubコード:https://github.com/HIT-SCIR/pyltpドキュメント:https://pyltp.readthedocs.io/zh_CN/latest/
インストール
マイコンピュータ環境:Windows 64ビット、python 3.6操作プレゼンテーション環境:pycharm
コンテンツのダウンロード模型ダウンロード:最新版の模型ltpをダウンロードするdata_v3.4.0ダウンロードアドレス:http://ltp.ai/download.html 2.ダウンロードLTP:pyltp-0.2.1-cp 36-cp 36 m-win_amd64.whlダウンロードアドレス:https://download.csdn.net/download/xiaoxy97/10525781備考:自分のパソコンのpythonバージョンとペアが必要です.私のはpython 3です.6
インストールプロセス
1、ダウンロードした2つのファイルを解凍する(フォルダ名は中国語では使わない)2、pyltp-0.2.1-cp 36-cp 36 m-win_amd64.whlは、自分のpythonインストールディレクトリの下のScriptsフォルダ(私のはD:pythonScripts)3にコピーし、cmdコマンドラインに入り、自分のpythonインストールディレクトリの下のScriptsフォルダに入ります(私のはD:pythonScriptsです).次に、コマンドラインを実行します.
4、Successfully installed pyltp-0.2.1が表示された場合、インストールに成功しました
5、検査:自分のpythonインストールディレクトリの下のScriptsフォルダに入ります(私のはD:pythonScriptsです).次に、コマンドラインを実行します.
図に示すようにインストール成功
実際の操作
1、charmを開き、新しいpythonプロジェクトを作成して次のコードを実行します.
備考:コード:segmenter.load(r’D:/NLP/ltp_data_v 3.4.0/cws.model’)では、モデルアドレスが最初にダウンロードしたltp_data_v3.4.0のモデルアドレス(cws.modelは分詞モデル)
哈工大言語クラウドプレゼンテーションプラットフォーム:http://www.ltp-cloud.com/GitHubコード:https://github.com/HIT-SCIR/pyltpドキュメント:https://pyltp.readthedocs.io/zh_CN/latest/
インストール
マイコンピュータ環境:Windows 64ビット、python 3.6操作プレゼンテーション環境:pycharm
コンテンツのダウンロード
インストールプロセス
1、ダウンロードした2つのファイルを解凍する(フォルダ名は中国語では使わない)2、pyltp-0.2.1-cp 36-cp 36 m-win_amd64.whlは、自分のpythonインストールディレクトリの下のScriptsフォルダ(私のはD:pythonScripts)3にコピーし、cmdコマンドラインに入り、自分のpythonインストールディレクトリの下のScriptsフォルダに入ります(私のはD:pythonScriptsです).次に、コマンドラインを実行します.
pip.exe install pyltp-0.2.1-cp36-cp36m-win_amd64.whl
4、Successfully installed pyltp-0.2.1が表示された場合、インストールに成功しました
5、検査:自分のpythonインストールディレクトリの下のScriptsフォルダに入ります(私のはD:pythonScriptsです).次に、コマンドラインを実行します.
pip.exe list
図に示すようにインストール成功
実際の操作
1、charmを開き、新しいpythonプロジェクトを作成して次のコードを実行します.
#itp-cws
from pyltp import Segmentor
def segmenter(sentence):
segmenter = Segmentor()
#
segmenter.load(r'D:/NLP/ltp_data_v3.4.0/cws.model')
words = segmenter.segment(sentence)
words_list = list(words)
segmenter.release()
return words_list
if __name__ == "__main__":
sentence = r" "
words = segmenter(sentence)
print(words)
備考:コード:segmenter.load(r’D:/NLP/ltp_data_v 3.4.0/cws.model’)では、モデルアドレスが最初にダウンロードしたltp_data_v3.4.0のモデルアドレス(cws.modelは分詞モデル)