Amazon Transcribe使ってみた

1653 ワード

概要

2017/11/30 AWSで文字起こしのPaaSが発表された。
https://aws.amazon.com/jp/blogs/news/amazon-transcribe-scalable-and-accurate-automatic-speech-recognition/

招待制ということでさっそく申し込んだが、いつになってもAWSから承認が降りず、すっかり忘れ去った2018/2/13にAWSからPreview使っていいよ。というメールをもらった。

ちなみにGCPでは似たようなサービスが既にあり、この点においてはGCPがAWSをリードしている。

使い方

S3に音声ファイルを置く。
Amazon Transcribeがそれを読む。
自動で文字起こしされる。これだけ。

Amazon Transcribeの入力項目

1) ジョブ名を決める。
2) S3のパスを入れる
3) 変換元の言語を選択
4) 音声フォーマットを選択
5) レートを入力(必須ではない)

Amazon Transcribeの注意するところ

S3にバケットを掘る際、東京リージョンは対象外である。とりあえず米国東部（バージニア）にした。
変換元の音声は現時点で英語,スペイン語の文字起こししか対応していない。日本語は対象外。
音声ファイルはmp3,mp4,wav,flacファイルでなければならない。m4aは対象外。無理やりやってもエラーになるw
Amazon Transcribeから読めるようパーミッションを適宜設定する。

変換時間

約25分のmp3データを文字起こしするのに約25分かかった。

Output

Json形式で出力される。

Author And Source

この問題について(Amazon Transcribe使ってみた), 我々は、より多くの情報をここで見つけました https://qiita.com/S-T/items/16d3139efb78881a3c44

著者帰属：元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。

Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .

n.関数

JSON.stringgify()オブジェクトと文字列の和