Amazon Transcribeでインタビューの文字起こしをしてみる

2257 ワード

Transcribe AWS AWS テキストリンク

目的

あるインタビュー音源の文字起こしを自動化出来ないかという検討の過程でAmazon Transcribeが候補に上がり、試してみることにしました。

参考にしたサイト

手順

S3を作成し、翻訳させるための生データを登録します。

ファイルの拡張子はWAV、MP3、MP4、FLACに対応していますので録音時にフォーマットに会うアプリで録音するか、録音後にffmpegなどの変換ソフトを使って変換します。

Amazon Transcribeのコンソール画面で「Create Job」を選択します。
言語は日本語を選択し、インプットファイルとして先ほど1.で登録したデータを設定し「Next」を実行します。

必要があればオプションを指定し、「Create」を実行します。
ステータスが「in progress」になっていることを確認します。
元ファイルが数MBくらいのサイズの場合は数分で「Complete」となり完成です。実際の翻訳結果をファイルとしてダウンロードし、内容を確認してください。固有名詞の翻訳はどうしても不自然な日本語になっていますが、まずまずの精度で翻訳出来ていました。

面白かったのは以下の点です。

文末にマルがついたり、疑問形で終わる会話に？がついていたこと。
英語は全部カタカナ表記となること。
数字は漢数字表記となること。

結果

非常に簡単な手順でかつ数分で実行できるのでなかなか良かったです。
文字起こししてそのまま記事することは出来ませんが、音源を聞いて手動で文字起こしするよりは楽だと感じました。

Author And Source

この問題について(Amazon Transcribeでインタビューの文字起こしをしてみる), 我々は、より多くの情報をここで見つけました https://qiita.com/ryosuk/items/878e9d60ffefba71b706

著者帰属：元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。

Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .

イオン+無限反応で無限スクロール

JavaScriptベース(10)JSON