バイリンガル整列ツールChampollion tool kitの構成と使用
サマリ
Champollionは当初、中英文を整列させるために開発され、ペンシルベニア大学言語データ連盟が開発し、その後、他の言語の文整列機能を拡張した.語彙にノイズがあると考えられ,複雑な文の整列パターンや文の欠落や挿入などを考慮した.辞書の位置合わせを主とし,長さ法の位置合わせを補助とする戦略を採用した.異なるのは、対応する語彙ごとにTFを使用することです.× IDFは重みを計算し,文中の異なる語彙が文の整列の結果に異なる影響を及ぼすと考えられる.
環境の説明
1.DB_をインストールするFile
インストール手順は次のとおりです.
ツールのダウンロード先:https://www.cpan.org/modules/by-module/DB_File/
2.champollionのインストール
インストール手順は次のとおりです.
ツールのダウンロード先:https://sourceforge.net/projects/champollion/
まず、champollion-1.2.tgzは「/home/[システムユーザ名]ディレクトリに解凍します.環境変数を設定します.変数の値は現在の解凍ディレクトリです.端末入力コマンド:
3.Champollionコード修正
4.テスト
champollionルートディレクトリで、コマンド「./test_installion」コンソール出力「The installation is good.」を実行します.インストールに成功しました.
Champollionは当初、中英文を整列させるために開発され、ペンシルベニア大学言語データ連盟が開発し、その後、他の言語の文整列機能を拡張した.語彙にノイズがあると考えられ,複雑な文の整列パターンや文の欠落や挿入などを考慮した.辞書の位置合わせを主とし,長さ法の位置合わせを補助とする戦略を採用した.異なるのは、対応する語彙ごとにTFを使用することです.× IDFは重みを計算し,文中の異なる語彙が文の整列の結果に異なる影響を及ぼすと考えられる.
環境の説明
:Ubuntu 16.04
:1.2
:DB_File-1.827.tar.gz
1.DB_をインストールするFile
インストール手順は次のとおりです.
ツールのダウンロード先:https://www.cpan.org/modules/by-module/DB_File/
tar -zxvf DB_File-1.827.tar.gz
cd DB_File-1.827
perl Makefile.PL
make
make test
make install
2.champollionのインストール
インストール手順は次のとおりです.
ツールのダウンロード先:https://sourceforge.net/projects/champollion/
tar -zxvf champollion-1.2.tgz
まず、champollion-1.2.tgzは「/home/[システムユーザ名]ディレクトリに解凍します.環境変数を設定します.変数の値は現在の解凍ディレクトリです.端末入力コマンド:
export CTK=/home/[ ]/champollion-1.2
3.Champollionコード修正
vim ./thirdparty/ldc-cn-seg/mansegment.perl
(1) 74 split(//,$_);” @_ = split(//, $_);
(2) sub read_dict() ,split; @_= split(); ”$_[0] @_[0] , $_[1] @_[1]”。
:mansegment-utf8.pl 。
4.テスト
champollionルートディレクトリで、コマンド「./test_installion」コンソール出力「The installation is good.」を実行します.インストールに成功しました.