Google BigQueryのデータをData Portalで可視化する


TableauやGoogleデータポータルなどのBIツールは、今やデータ分析業務で欠かせないものになりました。SQLでデータを抽出しダッシュボード化するスキルは、省力化にもつながることからデータ分析の現場で役に立つことも多いのではないでしょうか。今回は、Google BigQuery内のデータを、SQLを介してデータポータルで可視化してみたいと思います。

①まずはBigQueryにアクセスし、テーブルを作成します。今回はKaggleのオープンデータから、iOSアプリの価格や評価などをまとめたデータセットを使用しました(手順は以下URL参照)。

BigQueryを使ったデータ抽出・集計
https://qiita.com/esaeki/items/53ad9ed1b7c2f7ed5c75

②作成したテーブルに対して、下記のSQLクエリを実行します。今回は、アプリの価格の平均値を、ジャンルごとに集計してみました。

select
  prime_genre, round(avg(price))
from 
  `starry-center-282006.test01.table01`
group by
  prime_genre;

③クエリを実行後、ページ中段の「データを探索」→「データポータルで調べる」から、データポータルに遷移します。

④遷移後は以下のようになります。ページ右側から使いたいグラフの種類を選択、ディメンションや指標を設定することで、ビジュアライゼーションを作成できます。

今回は棒グラフを作成してみました。Medicalの平均額が突出して高い一方、Food&DrinkやBookなどの数値が低いことが分かります。

⑤このビジュアライゼーションは、データポータル内の「エクスプローラ」に保存され、「レポート」側から呼び出すことも可能です。

「レポート」タブ→「空のレポート」で新規のダッシュボードを作成し、新規で棒グラフを追加、データソースで先ほど作成したエクスプローラのデータを指定することで、同じグラフをレポート内に呼び出すことができます。他のグラフや表と合わせて、ひとつのダッシュボードにまとめることが可能です。

Tableauと接続すれば、より多様なビジュアライゼーションを作成することができるでしょう。また機械学習ツールのBigQuery MLを使えば、BigQuery上でSQLクエリを使って機械学習モデルを作成し、さらにBIツールで可視化できます。BigQuery MLについては、また次の機会に試してみたいと思います。