nlpirの使用

7422 ワード

NLPIRのダウンロードアドレス:
http://ictclas.nlpir.org/downloads
GitHubのアドレス:
https://github.com/NLPIR-team/NLPIR
 
2つのバージョンにはいくつかの違いがありますが、Eclipseを使用してプロジェクトを構築する方法について説明します.
一、NLPIR公式バージョン
ダウンロードしたフォルダのbinディレクトリは、下の図のようにNLPIR_WinDemo.exeはNLPIRのデモプログラムで、NLPIRの機能を理解するために実行してみることができます.
  nlpir的使用_第1张图片
エンジニアリングソースはsampleディレクトリの下にあり、C、C++、Hadoop、JAVA、Pythonなどの言語例が含まれています.
Eclipseで新規プロジェクトを作成JAVAプロジェクトディレクトリJnaTest_をインポートNLPIR,
(1)Eclipse -> File->import
  nlpir的使用_第2张图片
(2)JnaTest_を選択NLPIRが存在するパスは、Finishをクリックします
  nlpir的使用_第3张图片
(3)Eclipseプロジェクトの表示
  nlpir的使用_第4张图片
(4)NlpirTest.JAvaファイルにはmain関数が含まれています.次の文はNLPIRに必要なライブラリファイルを初期化します.
  nlpir的使用_第5张图片
CLibreryクラスはNlpirTestに含まれる.JAvaファイルでは、
CLibrary Instance = (CLibrary) Native.loadLibrary("H:\\workspace\\ictclas\\1\\ICTCLAS2015\\lib\\win64\\NLPIR", CLibrary.class);

関数loadLibraryはライブラリファイルの場所を渡す必要があります.ソースコードは多くの言語クラスライブラリを提供しています.私たちのプロジェクトはwin 64クラスライブラリをロードする必要があります.このフォルダの内容は以下の通りです.
nlpir的使用_第6张图片
(5)分詞データデータデータデータフォルダパスのロード
String argu = "H:\\workspace\\ictclas\\1\\ICTCLAS2015";
String system_charset = "UTF-8"; int charset_type = 1;  int init_flag = CLibrary.Instance.NLPIR_Init(argu, charset_type, "0");

H:\workspace\ictclas\1\ICTCLAS 2015は、Dataフォルダの親フォルダです.
このステップが完了すると、コードをデバッグできます.APIについてはマニュアルを読むことができます.
二、githubからダウンロードしたコード
ディレクトリにはNLPIR SDKディレクトリが含まれており、各ディレクトリはNLPIRが提供するコンポーネントです.NLPIR-ICTCLASディレクトリには、NLPIRコンポーネントのコードが含まれています.
EclipseにICTCLAS_をインポートJAvaエンジニアリング、エンジニアリングディレクトリは以下の図
  nlpir的使用_第7张图片
工事中にmain関数を記入していないので、NlpirTest.JAvaファイルにmain関数を追加
public class NlpirTest { public static void main(String[] args) throws Exception{
NlpirTest t = new NlpirTest();
      t.testParticiple();
} public void testParticiple() throws IOException {
.....

    }
.......
}

公式サイトとは異なり、ライブラリファイルをロードすると、システムタイプを自動的に判断し、プロジェクトの現在のディレクトリの下でライブラリファイルを検索できます.「プロジェクト現在ディレクトリ」のwin 32、win 64、linux 32、linux 64は、ライブラリファイルを含むフォルダです.
「プロジェクトの現在のディレクトリ」を自動的にロードし、分詞データディレクトリにデータを問い合わせる.これらのディレクトリを設定すれば、デバッグ作業が可能になります.
三、githubにおける「キーワード検索」のコンポーネントKey_Extract
プロジェクトカタログは以下の通りです.
  nlpir的使用_第8张图片
プロジェクトにjavaバージョンのサンプルコードを提供し、Eclipseを利用してプロジェクトをインポートする
  nlpir的使用_第9张图片
同じようにKeyExtractorでJAvaファイルにmain関数を追加します.KeyExtract_GetKeyWordsの最初のパラメータはキーワードを抽出するテキストであり、2番目のパラメータはキーワードの個数である.
 public static void main(String[] args) {
String keyWordsStr = CLibraryKeyExtractor.instance.KeyExtract_GetKeyWords(args[0], 10, true);
System.out.println(keyWordsStr);
CLibraryKeyExtractor.instance.KeyExtract_Exit();
}

プロジェクトの現在のフォルダの下に、分詞とキーワード抽出に必要な分詞データのDataディレクトリがあります.必要なlicenseをこのフォルダにインポートする必要があります.どのuserファイルを使用するかを区別する必要はありません.すべてのファイルを現在のプロジェクトディレクトリDataフォルダに入れることをお勧めします.
nlpir的使用_第10张图片  
これらの設定が完了すると、Eclipseにパラメータ、メニュー項目run->run configureが入力されます.
nlpir的使用_第11张图片  
四、jarのエクスポート
Eclipseプロジェクトディレクトリで、右クリックでExportを選択
  nlpir的使用_第12张图片
runnablejarを選択してjarファイルを生成
nlpir的使用_第13张图片  
その後cmdで実行でき、パラメータを伝達し、効果は以下の通りです.
nlpir的使用_第14张图片由来:http://www.cnblogs.com/jbexploit/p/4572791.html