オープンデータをGoogleデータポータル(Data Studio)で可視化してみた【初心者】


Googleデータポータル(Data Studio)とは

Google Data Studioは、Googleが提供するカスタムレポートやダッシュボードを手軽に作成するためのツールです。

使用するオープンデータ


今回はkaggleWorld Happiness Report(世界幸福度調査レポート)を使用します。
World Happiness Reportは、世界の幸福の状態に関する調査です。155カ国と地域を幸福度でランク付けしたものです。項目は幸福度に関わると考えられる以下の8つです。この項目は毎回見直され、更新されています。
そのため2019年と同じ項目なのは2018年のものだけです。

今回は初回のため、その中で2019年だけを使用していきます。

項目(原語) 項目(日本語)
Country or region 国・領域
Score 幸福度
GDP per capita 一人当たりのGDP
Social support ソーシャルサポート
Healthy life expectancy 健康寿命
Freedom to make life choices 人生の選択をする自由
Generosity 寛大さ
Perceptions of corruption 腐敗の認識


World Happiness Report|kaggle

ダウンロードしたデータ

こちらがダウンロードしたデータになります。通常は前処理が必要となりますが今回はそのままBigQueryに入れても文字化けやエラーにはならないため、このまま入れます。
ダウンロードしてきたCSVデータの文字コードはShift-jisのため、
そのまま読み込むと文字化けが起きます。必ず文字コードはUTF-8に変換してからアップロードしましょう。
(BigQueryはUTF-8しか対応してないらしいです。)

BigQueryにデータを入れて抽出・集計する

BigQueryにデータをいれる

BigQueryにデータをいれていきます。
データの入れ方は下記記事と殆ど同じです
BigQueryにオープンデータを入れてみた【初心者】

クエリを実行する

select Country_or_region, Score, GDP_per_capita, Social_support
from score.2019
order by 1 desc
limit 10;

データを確認する

このようにデータが書き出されています。
こちらを可視化していきます。

ビューとして保存

上記の結果を、Google Data Studioに接続して使用するため、ビューとして保存をします。
今回はScore-という名称とします。

こちらで準備は完了です。
GoogleDataStudioにて可視化をしていきます。

GoogleDataStudioで可視化する

BigQueryと接続する

まず、下記GoogleDataStudioのページにアクセスし、新しいレポートの開始を選択します。
Google Data Studio
画面右下の「新しいデータソースを作成」ボタンを押下し、先ほど作成したデータを読み込んでいきます。

先ほど保存したビューを選択し、BigQueryと接続します。
BigQueryと接続を行うと、下記画面が出てきます。

「空のレポート」の部分をクリックし、「BigQuery」を選択し、「BigQuery→worldhappiness→score→GDP-socialsupport」
」先ほど保存したデータを選択します。

選択したのち、グラフ・表など可視化できるようになりました。

今回は、生データではなくすでにデータ化されているものをそのまま可視化しました。
幸福度数がトップ10の国とGDPに関係性があるのかどうかを確認するためのグラフ化ですが、このデータだけでは関係性も見えないので、GDPが低い国との比較も必要と考えます。
今後は地域分類をしてアジアやヨーロッパなどの地域性が関係があるか、それとも貧富の差での幸福度数に差が出るのかなどのことも調査してみたいですね。初心者が一データでできるのはここまでだったので次回の課題としてみます。

Google Data Studioで可視化してみた

今回は初心者がオープンデータをGoogle Data Studioで可視化するまでをやってみました。今後は統計の勉強と生データからのオープンデータを分析し可視化するところまで進めることにします。