Mac で完全フリーの音声認識エンジンJuliusを試してみた

4220 ワード

Mac 音声認識 Julius Mac テキストリンク

はじめに

今，音声認識はいろいろなところで使われ始めています．
しかし，音声認識をしてみようと思うと意外と難しいのが現状です．
１から作るのは無理だし，GoogleやMicrosoftは音声認識は無料で使おうとすると制限が大きいし．．．と悩んでいる方も多いと思います．
そんな人に最適な，完全フリーのJuliusを使ってみたいと思います．

ゴール

・ターミナルからデモを起動し，マイク入力から直接音声認識ができるようになる

事前知識

Julius

http://julius.osdn.jp/index.php
音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジン
使う上での利点として，ほぼリアルタイムかつオフラインでも使用できるのが特徴です．
Julius自体はあくまで音声認識エンジンであり，音声認識をするには別に音響モデル・言語モデルが必要になる．（それも配布してるよ）

インストール

準備

最初に，brewをインストールしていない方は以下のコマンドを打ってインストールしてください．

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

~~次に，flew，portaudioを順にインストールします．~~
~~（juliusを動かすのに必要らしい）~~
※追記：Mac OS 10.13.5 で試した所、これらのパッケージをインストールしていない状態でもインストールできました。

$ brew install flex //必要なし
$ brew install portaudio //必要なし

Julius インストール

以下のページからjuliusのtarファイルをダウンロードし，作業ディレクトリにもっていきます．
https://ja.osdn.net/projects/julius/releases/66547#note

その後，以下のコマンドを実行してJuliusコマンドをインストールします．

$ tar xvzf julius-4.4.2.tar.gz
$ ./configure
$ make
$ sudo make install

ヘルプコマンドを実行して，インストールに成功しているか確認しましょう．

$ julius --help

次に，先ほど書いたように音響モデル・言語モデルもダウンロードしましょう．
なぜかtar.gzファイルをダウンロードしてもうまくいかなかったため，今回はzipファイルをダウンロードします．

ディクテーションキットのダウンロード

先ほど述べたように音響モデル，言語モデルが入ったディクテーションキットを配布しているので，ダウンロードします．
（ここに実行バイナリもあるのでJuliusをインストールしなくても動くらしい
→自分は上手くいきませんでした）
以下から最新（もしくはお好み）のdictation-kitをダウンロードしましょう．
https://ja.osdn.net/projects/julius/
ダウンロードしたら，作業ディレクトリに展開します．
そこまでできたら，以下のコマンドを打ってみましょう．

julius -C main.jconf -C am-dnn.jconf -dnnconf julius.dnnconf -nostrip

### read waveform input
STAT: AD-in thread created
<<< please speak >>>

と出てきたら，何か話してみて下さい．

sentence1:  今日 の 夜 ごはん は カレー ライス だ よ 。
wseq1: <s> 今日+名詞 の+助詞 夜+名詞 ごはん+名詞 は+助詞 カレー+名詞 ライス+名詞 だ+助動詞 よ+助詞 </s>

こんな感じで音声認識できました．
体感そこそこな精度で認識してくれました！

参考URL

julius公式ホームページ
http://julius.osdn.jp/

公式のトリセツ的なやつ
https://jaist.dl.osdn.jp/julius/47534/Juliusbook-4.1.5-ja.pdf

Terminal (macOS): Julius で音声認識をする
http://snippets.feb19.jp/?p=1734

MacでJuliusインストールする方法
https://qiita.com/amano-kiyoyuki/items/41f250a52e0929001e1f

Author And Source

この問題について(Mac で完全フリーの音声認識エンジンJuliusを試してみた), 我々は、より多くの情報をここで見つけました https://qiita.com/sgr0416st/items/928fb2bde28e17eda274

著者帰属：元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。

Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .

log 4 jのいくつかの使用の心得について

MUIドロップダウンリフレッシュアップロード実装