PostgreSQLサンプルデータを発見惑星



PostgreSQLは、私たちの最も人気のある、強力なストレージプラットフォームの一つのままです.他の記憶技術は行き来しているが、現代のPostgresはそれほど多くのアプリケーションに対して堅固な選択である.この記事では、PostgreSQLのためのaivenから始める方法を見てみましょう.
あなたがPostgreSQLのためにあなたの最初のaivenを回転させるとき、あなたは機能で遊ぶために若干の時間をとりたいです..しかし、問題があります.あなたの新しい光沢のあるデータベースは空です.
いくつかのオープンデータセットの発見と使用は、このギャップを埋める素晴らしい方法です.一つのオプションはKaggle のりばそれは開いているデータを見つけるための場所、データサイエンスについてのアドバイス、あなたのスキルを磨くために参加することができますいくつかの大会.から選択するデータセットの選択がかなりあります、しかし、今日、私は使用していますexoplanets data Kepler任務から.ログインしてデータをダウンロードする(無料)アカウントが必要になります.前に移動し、zipファイルを抽出、私は使用しているcumulative.csv このポストの例のために.

aivenから始めましょう


あなたがすでにAivenユーザでないならば、あなたはそうすることができますsign up for an Aiven account このポストのステップに従うために-我々は、ちょうどここで待ちます!
我々はまた、使用されますAiven CLI . このツールはPython 3.6以降が必要です.
pip install aiven-client
また、CLIツールに対してaivenアカウントを認証する必要があります.以下のコマンドを実行します.
avn user login <[email protected]>
これで、クラウド内のAIVENデータベースを作成するために必要なすべてがあります.

PostgreSQLサービスを作成する


良い第一歩は、サービスを維持するプロジェクトを作成することです.必要なのは名前です.
avn project create exoplanets
Aivenはサービスを作成するときに多くのオプションを提供していますが、すぐに行くようになりました.最新のPostgresを利用し、「ホビイスト」と呼ばれる最小のパッケージを使用します.最も楽しいものの1つは、あなたが好きであるどんなクラウド・プラットホームも選ぶことができています!リストをチェックして、コピーしてくださいCLOUD_NAME お気に入りのフィールド
avn cloud list
選んだgoogle-europe-west1 私の例では.以下はPostgresデータベースを作成するために実行するコマンドです(選択したクラウドでスワップするのを忘れないでください).
avn service create -t pg -p hobbyist --cloud google-europe-west1 pg-exoplanets
ノードは、準備ができて数分かかりますが、AivenのCLIは、サービスが私たちと話をする準備が整うまで、返されない便利な“待機”コマンドを持っています.これは私がここで持っているように、コマンドを手で実行することにとっては重要ではありません.しかし、CIシステムがデータプラットフォームを自身で回転させるとき、それは非常に役に立ちます!
avn service wait pg-exoplanets
コマンドが戻ると、PostgreSQLクラスタが使えるようになります.サンプルデータを保持するデータベースを作成しましょう以下のコマンドは"ExterPlanet "という名前の名前を作ります:
avn service database-create --dbname exoplanets pg-exoplanets
今、私は光沢のある新しいデータベースを持っています.しかし、それはすべて悲しいと空です.サンプルデータを見てみましょう.

PostgreSQLへのCSVデータの追加


PostgreSQLには既存のテーブルにCSVデータをインポートするための組み込みサポートがありますが、CSV形式のテーブル構造はありません.幸運にもそのためのツールがありますddlgenerator もう一つのPythonコマンドラインツールです.
インストール方法ddlgenerator ツールを生成し、CREATE TABLE ステートメントcumulative.csv もっと早くダウンロードしました.
pip install ddlgenerator
ddlgenerator postgres cumulative.csv > create.sql
ファイル内の外観を持っていて、PostgreSQLにデータを保持する方法について説明する必要がある構造があることがわかります.The avn service cli コマンドは私たちを与えるpsql 新しいデータベースにプロンプトを表示します.
avn service cli pg-exoplanets
内部からpsql 「外部惑星」データベースに接続し、SQL構造体を実行して表構造を作成します.
\c exoplanets
\i create.sql
パズルに最後のピースを追加し、まだpsql プロンプト、次のコマンドはCSVデータを持ってきます.
\copy cumulative from data/cumulative.csv csv header
素晴らしい仕事!The cumulative テーブルは今あなたと遊ぶためにいくつかのデータが必要です!

惑星の夢を見る


今、あなたはKappler宇宙望遠鏡によって撮影された外惑星の測定の完全なデータベースを持っている.あなたがすでにプロジェクトに精通していないならばNASA mission page 読む価値がある.ミッションのうちの1つが失敗したとき、ミッションは2番目の段階に入りました.そして、それは我々が我々が見ることができて、触れることができるか、少なくともSSHに入るエンジニアリングシステムがスペースで動くよりずっとギグであると私たちに思い出させるのに役立っています!
あなたは観測を記述し、既存の文献の各状態のKepler評価を公式の状態と比較するデータセットを探索することができます.たとえば、Keplerによって識別された偽陽性を参照してください.
select kepler_name, koi_pdisposition from cumulative where koi_disposition = 'CONFIRMED' and koi_pdisposition = 'FALSE POSITIVE';
また、データセットをさらに使用する他のツールにこのデータを接続することもできます.Webコンソールまたは接続からの接続の詳細を取得するjq with avn ワンライナー用
avn service get pg-exoplanets --json | jq ".service_uri"

次は何ですか。


良い雲実験の実践は、あなたがあなたの惑星外データベースで終えたならば、あなたはそれを削除することができると示唆します:
avn service terminate pg-exoplanets
もっと楽しく学びましょう.

  • Kaggle Open Datasets あなたが空想的な惑星外でない場合には、いくつかの優れた選択肢がここにあります
  • 我々のドキュメンテーションでは、あなたは見つけることができますinstructions for migrating your existing PostgreSQL to Aiven
  • についてAiven CLI, avn
  • PostgreSQLが必要ですか?チェックアウトintroduction to PostgreSQL ポスト