DeepGramのX devのhackathonの提出ポスト


私の提出の概要


IO - 1つのコマンドは、オーディオを録音するためにN分、記録ファイルとそれからの転写を取得します.つのコマンドは、ファイルを翻訳します.Java/springの実装で転写を取得します.SDKのノードです.JSとPythonとCとがあります.

提出カテゴリ


アクセシビリティ

ギタブ


マハディフ / イオ翻訳


言語翻訳プロジェクト


イオ翻訳


言語翻訳プロジェクト
これは、テキスト翻訳への深遠なスピーチを提供している春のシェルプロジェクトです
MVNスプリングブーツ
シェルコマンド
これはN分の録音オーディオを開始し、全体のオーディオが転写され、メモ帳に表示されます
sptt { id }を停止します.
file { filepath }{ language ( optional )}-ファイルの録音/記録を翻訳します.WAVは英語にファイルを翻訳して、あなたに転写を示します
View on GitHub

追加情報


io - translateshellを翻訳します。Javaグーグルドライブ



ドライブ.グーグル.コム
translate-file recordings/song.mp3 it-ベラ・チャオ転写.

マイディープケースユースケース


皆さん、Deepgram APIで春シェルにようこそ.ディープグラムは、Python、ノードのSDKを提供していた.JSとCは、私は信じます.また、そのアイデアの一つは、言語に基づいてオーディオを翻訳し、その転写物を人が理解している言語に翻訳することでした.私たちはスペイン語の映画を見ているように、私たちはスペイン語のトランスクリプトを取得し、我々は英語に翻訳できるいくつかのサービスに、このスペイン語のトランスクリプトを送信することができます.
didntこの時間を取得します.
私はいくつかの音声をJavaとのテキスト翻訳に実装しようとし、それに挑戦した.私はマルチスレッドに取り組んでいないが、過去2日間で私はたくさん学んだ.

このアプリケーションは、春のブートとスプリングシェルで構築されています.
春のシェルは、あなたがクールであることがわかった実行するコマンドを入力し、私はそれに基づいて何かを開発したいと思いますし、私は金曜日にこのハッカーのことを読んで、なぜか?
私が考えていたアプリケーションの構造は次のようになります.
コントローラ-コマンドを受け取り、TranslateServiceに渡します.
複数のサービスを提供しています🤷‍♂️) など
副サービス-そこには、テキストをサポートすることができますAPI API、ライブ翻訳など..しかし両方のAPIをサポートしていない可能性がありますので、2つのインターフェイスSpeechToTextとLiveTranslationとDeepGramを実装します.
そして、主要なサービスは我々が望むサブサービスを呼ぶでしょう、現在、それはDeepgramです、そして、我々が変えたいならば、我々は簡単に良い抽象化とゆるいカップリングを持っているインターフェースを実装しているクラスを持つことができます.これは私が考えたものです、そして、あなたがコードを通過するとき、何が起こったかについてわかっています.
サブサービスはタスクを実行し、結果を返します.
今、私はJSでこれの実現が最も簡単な方法であると思います、しかし、あなたはJavaがマルチスレッドの上で多くを私に緊張させたということを知っています.
マルチスレッドは主にプログラムが他の機能を実行するようにオーディオを並列キャプチャするために必要です.

機能を簡単にするには、次のコマンドを参照してください.sptt <minutes> <seconds> <language (Optional)>n分とm秒のオーディオをキャプチャし、プロジェクトの録音フォルダに保存される転写のための記録を送信します.stop-sptt <threadid> to stop a running transcription.translate-file <filepath> <language>プロジェクトを実行します
ファイルのコピーを生成します.ヒンディー語オーディオの場合は、言語で“こんにちは”を提供することができます.
ビデオを見るとチェックアウトプロジェクトは、より良い理解を得るために.
私は多くのクールなプロジェクトをたくさんの人々のおかげであなたにすべてを見た.ハッピーコーディング!