ビデオからの自動ブログ柱をつくってください



私の提出の概要


このチュートリアルでは、ビデオから自動的にブログ記事を作成する方法をお教えします.コンテンツの作成者なら、これは非常にあなた自身のビデオチュートリアルを使用して新しい記事を書くのプロセスをスピードアップするのに非常に便利かもしれません.

提出カテゴリ


分析論大使

Githubのコードへのリンク


見見 / 自動ブログ柱



自動ブログ柱



自動ブログ投稿は、Pythonプロジェクトは、ビデオから自動的にブログの記事を生成するために作成されます.
drawing
最後のブログ記事は、5つの主要な構成要素から成ります:タイトル、要約、イメージ、テキストとキーワード.上のイメージはこのアーキテクチャがどのように機能するかを表しています.ご覧のように、これは自然言語処理を用いた機械学習プロジェクトです.
まず、オーディオを抽出するためにビデオを処理する必要があります.ディープグラムAPIを使用すると、テキストに音声を行うことができます.その後、テキストを段落に分割しました.そのために、私たちは、文が同じパラグラフに属しているか、新しいものであるならば、見つけるために語の間の休止を分析しています.
それから、我々はテキストキーワードと要約をつくるために、若干の予め訓練された機械学習モデルを使います.また、私たちのブログの投稿画像とタイトルになるビデオのサムネイルと名前を取得します.

どうやって使うの?



View on GitHub

追加情報



マイディープケースユースケース


最後のブログ記事は、5つの主要な構成要素から成ります:タイトル、要約、イメージ、テキストとキーワード.上のイメージはこのアーキテクチャがどのように機能するかを表しています.ご覧のように、これは自然言語処理を用いた機械学習プロジェクトです.
まず、オーディオを抽出するためにビデオを処理する必要があります.ディープグラムAPIを使用すると、テキストに音声を行うことができます.その後、テキストを段落に分割しました.そのために、私たちは、文が同じパラグラフに属しているか、新しいものであるならば、見つけるために語の間の休止を分析しています.
それから、我々はテキストキーワードと要約をつくるために、若干の予め訓練された機械学習モデルを使います.また、私たちのブログの投稿画像とタイトルになるビデオのサムネイルと名前を取得します.

始める


プロジェクトを実行する最初のステップはDeepGram accountを作成することです.その後、APIキーを生成できます.this pageで、ボタンをクリックするだけで新しいAPIキーが作成されます.あなたは、キーの名前を選択し、許可を設定し、有効期限を設定する必要があります.

ボタンをクリックすると、新しいキーが作成され、それを安全に保つことが重要です.
コードを実行するには、Pythonをインストールする必要があります.私の提案は、オープンソースのPython配布プラットフォームであるAnacondaを使うことです.
私も、あなたがこのプロジェクトのために特に新しい環境をつくることを勧めます.Condaをダウンロードして仮想環境を設定する方法を学ぶチュートリアルをチェックしてください
Pythonパッケージをインストールするには、Conda Getting Startedだけで次のコマンドを実行します.
pip install -r requirements.txt
次に、コマンドを実行します.
python generate_blog_post.py --deepgram <api_key> --video <youtube_url>
注:これはデモンストレーションのチュートリアルです、あなたが生産でこれを使うつもりならば、私はあなたがDeepgram APIキーを保存するためにキーVaultを使うことを勧めます.
数分後に、あなたの出力ディレクトリにブログポストMarkdownファイルを見ます!

プロジェクトのクローン 細部に飛び込む


コード:
  • は、指定されたビデオURL
  • からオーディオをダウンロードします
    サムネイルからの
  • ダウンロードイメージ
  • は、イメージ
  • の黒い境界を収穫します
  • は、処理されたイメージ
  • を保存する
  • は、Deepgram API
  • を使用しているオーディオから、テキストを生成する
  • 句読点
  • を修正するテキストを処理します
  • は、ヒューリスティック
  • として単語と句読点の間の中央のポーズを使用してテキストを新しい段落に分割します
  • はテキスト
  • を格納します
  • は、keybert
  • を使用しているテキストからキーワードを得ます
  • は、訓練済み を使用して要約を取得する
  • は、マークダウンテンプレート
  • を作成します
  • は、タイトル、イメージ、概要、キーワードとテキスト
  • でMarkdownテンプレートを満たします
  • は、出力ディレクトリ
  • にMarkdownを保存する

    ハグフェイス 後処理


    いくつかのテキスト後処理が必要な場合は、EditCam BlogCage Postモジュールを使用できます.あなたのビデオが何らかの特定の語を持っているならば、これは役に立つことがありえます.例えば、略称「ASR」(自動音声認識)を「R」として捉えた.したがって、processRound辞書で.あなたのキー値ペアを“R”として置く必要があるJSONファイル:“ASR”.
    processRound辞書.JSONは次のようになります.{
    "As r": "ASR",
    "Ai": "AI",
    "Apis": "APIs"
    }
    次に、自動的にこれらの単語を置換するには、次のコマンドを使用できます.前の処理を再利用するので心配しないでください.それで、それはオーディオをダウンロードしないか、再びそれを転写しようとします.
    python edit_blog_post.py --video <youtube_url>
    
    さて、今あなたのポストは準備ができていると同じパスに保存!

    結論


    今、すべてが解決されます.テストしましょう.デモンストレーション目的のために、我々はYouTubeの上でDeepgramビデオチュートリアルを使用しています.
    最後のブログ記事

    深さとは何か


    <翻訳>
    ほとんどの自動音声認識サービスやASRは50年以上の技術に組み込まれています.古い技術は、短い通話と応答オーディオの罰金ですが、それだけで会話オーディオのために動作しません.我々は、実際に使用可能なトランスクリプションを提供するエンドツーエンドの深い学習ニューラルネットワークを構築し、それはさらに、電光石火の速度で時間をかけてより良い取得します.

    音声有効な経験は、最近ビジネスで大きな取引です.良い経験のためには、リアルタイムの正確な転写の基礎が必要です.しかし、ほとんどの自動音声認識サービスやASRは50歳以上の技術に組み込まれています.
    はい、これらの人々さえ.古い技術は、短い通話と応答オーディオの罰金です.Alexa、今日の天気は?しかし、それは会話オーディオのために動作しません.私はスーパーユーザーサービスに問題があります.これが起こっている.音声データの実際の使用をするためには、転写は、高速、コスト効率の高い、スケーラブルである必要があります.古い技術では、これらの要件の1つまたは2つを得ることができます.しかし、どんなに一生懸命彼らが試しても、彼らはすべての4を与えるためにそれを適応することはできません.それで、我々はそれを再発明しました.やあ、我々は深さです.エンドツーエンドの深い学習ニューラルネットワークを構築した.何?申し訳ありませんが、実際に使用可能なトランスクリプションを提供するAIの音声プラットフォームは、さらに、電光石火の速度で時間をかけて取得します.どのようにハードウェアコストや高い転写コストなし.そして、我々はより速く、安く、何を推測しているので.また、よりスケーラブルです.
    ので、右のAPIが不足しているので、その偉大な声機能を構築を避けてきた場合.良いニュース、仕事を始める時間です.トリプルエスプレッソ、どうか、あなたは正確なリアルタイム転写を行うことができますか?ああ、私たちの頭の上だけで、会話のAIを作成することができます.仮想支援音声解析エージェントは、コンプライアンスの改善より良い顧客体験を有効にします.ちょうどいくつかの名前を付けます.我々は、あなたが大きく行くのを援助するために、ここにいます.あなたがどこで始めるかわからないならば、心配しないでください.最高の技術スタックを提供することに加えて、Deepgram優れたパートナーになります.我々は、世界が常に変化している知っている.そして、あなたのオーディオと転写は、2を必要とします.あなたのデータのラベリングから、カスタムのAIモデルをPrem上またはクラウド内での展開にトレーニングする方法のすべてのステップとなります.あなたの転写の基礎を確実にするには、実際にあなたの顧客を喜ばせる経験に電力を供給しています.
    もしあなたが理想的な解決策に沿ってチャッジングを停止し、偉大な声の製品を構築を開始する準備が整いましたら、我々はそれが深いグラムを発生させるために準備が整いました.
    これを読んでくれてありがとう.コメントを残して自由に感じる.それが役に立つことを願っています.いくつかの知識を共有しましょう!次のポストでお会いしましょう!)