各種音声オープンデータセット(OpenSLR,kaggle-TIMIT）に関するメモ

2009 ワード

音声データーセットに関するメモです。

OpenSLRデーターセット

dev-clean.tar.gz [337M]   (development set, "clean" speech )   Mirrors: [China]  
dev-other.tar.gz [314M]   (development set, "other", more challenging, speech )   Mirrors: [China]  
test-clean.tar.gz [346M]   (test set, "clean" speech )   Mirrors: [China]  
test-other.tar.gz [328M]   (test set, "other" speech )   Mirrors: [China]

解凍したディレクトリ直下のBOOKS.TXTが音声データーの書き下しになっています。
また中で更に細かくデーターが小分けされてされておりtranscriptが記述されています。

dev-clean

データー形式はflac
359mb

dev-other

データー形式はflac
337MB

test-clean

データー形式はflac
368MB

test-other

音声形式はflacで入っている。
音声データーサイズは352.7MB

kaggel-timitデーターセット

Speak_Recog_Data

これは特にtranscript等はなく音源のみのデーターセットです
.wavで入っています

DARPA TIMIT

以下のようなデーターフォーマットになっています


test_data.csv
test_data.csv
31.7k x 12
train_data.csv
31.7k x 12
PHONCODE.DOC
PROMPTS.TXT
README.DOC
SPKRINFO.TXT
SPKRSENT.TXT
TESTSET.DOC
TIMITDIC.DOC
TIMITDIC.TXT
\data.zip
  --TEST
  --TRAIN

data.zip内にあるTEST内にDRディレクトリ内にtranscriptと一緒に各種.wav音声データーが入っています。
TRAINも同様にtranscriptと一緒に.wavが格納されています。

Author And Source

この問題について(各種音声オープンデータセット(OpenSLR,kaggle-TIMIT）に関するメモ), 我々は、より多くの情報をここで見つけました https://qiita.com/T_keigo/items/5560b6dde4db7ba7bed5

著者帰属：元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。

Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .

mysqlデータベースidプライマリ・キーの増加削除後の不連続の問題解決

smartyテーブル改行例