そこそこ実用的な翻訳アプリを開発してみる (3) 翻訳サービスの実装


そこそこ実用的な翻訳アプリを開発しましたので、その構成や作り方を記録しておきます。コード は MITライセンスですので、参考になるところがあれば部分的にでも使ってみてください。

目次

翻訳機能を実装しよう

翻訳サービスの作成と接続

IBM Cloud のカタログで、AI カテゴリにある Language Translator をクリック。

価格プランが「ライト」なのを確認して、そのまま右下の「作成」ボタンをクリック。入門チュートリアルが表示されるのでよく読み、またブックマークしておきましょう。これで翻訳サービスが作成されました。

次にダッシュボードに戻り、さきほどアップロードしたNode.jsアプリを選択します。

「接続」メニューにある「接続の作成」をクリック。

さきほど作成した Language Translator サービスが表示されるので「接続」をクリック。

IAMサービスの接続に関するポップアップが表示されるので「接続」をクリック。

アプリの再ステージに関するポップアップが表示されるので「再ステージ」をクリック。

アプリの概要ページに戻り、再ステージが問題なく完了して「実行中」の表示に戻っていることと、接続の欄に Language Translator サービスが追加されていることを確認しましょう。

これで翻訳サービスの作成と、rtk-lt アプリへの接続は完了です。

翻訳サービスのアプリへの組み込み

Node.js 環境では Watson APIs Node.js SDK モジュールを使用します。まずは組み込みましょう。

npm install --save watson-developer-cloud

【追記】いまは ibm-watson というモジュールに更新されています

シンプルに翻訳サービスを呼び出してみる

Watson APIs Node.js SDK にある LanguageTranslator 用のサンプルロジックを、わりとそのまま Server.js の中に追加してみます。

Server.js
const LanguageTranslatorV3 = require('watson-developer-cloud/language-translator/v3');

let lt_apikey = '<your apiKey>';
try {
    let lt_obj = JSON.parse(process.env.VCAP_SERVICES);
    if (!!lt_obj.language_translator[0].credentials.apikey) {
        lt_apikey = lt_obj.language_translator[0].credentials.apikey;
    }
} catch (e) {}

languageTranslator.translate(
    {
        text: 'A sentence must have a verb',
        source: 'en',
        target: 'ja'
    },
    function(err, translation) {
        if (err)  {
            console.log('error:', err);
        } else  {
            console.log(JSON.stringify(translation, null, 2));
        }
    }
);

translate 関数に関しては、英語ですが こちら の API ドキュメントが非常に判りやすいです。

環境変数である VCAP_SERVICES を参照しているところは独自に追加した部分です。IBM Cloud 上でアプリにサービスを「接続」すると VCAP_SERVICES という環境変数にいろいろな値を設定してくれる仕組みがあるんですよね。それを利用しているって訳です。

VCAP_SERVICES にどんな値が指定されるか知りたい方は、IBM Cloud でアプリの「ランタイム」にある「環境変数」を参照してみてください。

さて、これでサービス利用に必要な情報(apiKey)が得られる訳ですから、上記コードは IBM Cloud 上では動作するはずです。以下のように cf push した後、ログを表示して確認してみましょう。

cf push -m 128M rtk-lt
cf logs rtk-lt --recent

プログラム中に記述された 'A sentence must have a verb' という英文に対する日本語訳が、ちゃんとログに表示されているのがわかります。

なおローカル環境で動作させる場合は、環境変数 VCAP_SERVICES がありませんので、他の方法で apiKey の値を設定しておく必要があります。

さきほどのランタイムの環境変数から、もしくは「接続」から資格情報を表示させて apiKey の値を入手します。


入手した apiKey の値をプログラム中の '<your apiKey>' 部分に設定すれば、ローカル環境でも翻訳機能が動作するようになります。

翻訳サービスのAPI化

翻訳サービスの呼び出しに成功したので、ロジックを修正してAPI化します。まずは POST アクセスを処理するため body-parser モジュールを導入。

npm install --save body-parser

languageTranslator.translate() を実行していた部分を以下のように書き換えて POST API アクセス対応にします。

Server.js
const bodyParser = require('body-parser');

app.use(bodyParser.json({strict: true}));
app.post('/translate', (req, res) => {
    console.dir(req.body);
    languageTranslator.translate(
        {
            text: req.body.text,
            source: req.body.source,
            target: req.body.target
        },
        function(err, translation) {
            if (err)  {
                res.status(500).send('error:' + err);
            } else  {
                res.status(200).send(translation.translations[0].translation);
            }
        }
    );
});

curl コマンドを使って、ローカル環境で POST API の動作を確認してみましょう。送った英文が日本語訳されているのがわかります。

curl http://localhost:3000/translate -H "Content-Type: application/json" -d '{"source":"en","target":"ja","text":"This is a pen."}'

Windows コマンドプロンプトの場合、json の中身をエスケープする必要があり以下を使用してください。

curl http://localhost:3000/translate -H "Content-Type: application/json" -d "{\"source\":\"en\",\"target\":\"ja\",\"text\":\"This is a pen.\"}"

※ Windows コマンドプロンプトの場合、返された日本語が文字化けすることがあります。この場合には chcp 65001 コマンドで utf-8 モードに切り替えてください。chcp 932 で元に戻ります。

cf push して IBM Cloud 上でも同じように POST API が利用できるのが確認できます。

curl https://rtk-lt.mybluemix.net/translate -H "Content-Type: application/json" -d '{"source":"en","target":"ja","text":"This is a pen."}'

Windows コマンドプロンプトはこちら。

curl https://rtk-lt.mybluemix.net/translate -H "Content-Type: application/json" -d "{\"source\":\"en\",\"target\":\"ja\",\"text\":\"This is a pen.\"}"

まあ API と言っても、受け取った POST のデータをそのまま、翻訳サービスに投げているだけで、たいした処理はしていません。なのでコードもめっちゃシンプルです。

学習モデル

ついでに、今回の翻訳に使用するモデルの情報を表示させておきましょう。以下のコードを追加します。

Server.js
languageTranslator.listModels(
  {},
  function(error, response) {
    if (response.models) {
      console.dir(response.models.filter(m => m.model_id.indexOf('ja') >= 0 ));
    }
  }
)

Server.js を実行すると、以下のように日英/英日の翻訳モデルの情報が表示されます。

※ 実はモデルは様々な言語用に数多く定義されていて、filter関数で日本語関連の2つのモデルだけを抜き出しています

どちらの customizable の値も true で、学習可能であることを確認できました。確認後は上記のコードを削除するか、コメントアウトしておきましょう。

というわけで

さて、これで Node.js アプリに、翻訳を実施する API を追加することができました。次回は (4) ログサービスの実装 を実施します。GitHub 上の ソースコード も参照してみてください。