Dataiku DSS Dashboardsでお手軽にデータ整理


はじめに

データ分析に活用できるDataiku DSSのDashboardsについて簡単に使い方を紹介します。
これを使うことで、プロジェクト内で作成したグラフやデータセットを簡単に整理することができます。
また、Dashboardsにまとめておくことで毎回各データセットのCharts画面を開く必要もなくなります。

準備

使い方を説明するにあたり、簡単にデータを用意します。
そこでFlow画面からpythonのレシピを作成しましょう。
inputのデータセットは不要で、outputはstudentにしておきます。
pythonスクリプトを以下のように書き、乱数で学校の生徒のテスト結果のテーブルを作ります。

# -*- coding: utf-8 -*-
import dataiku
import pandas as pd, numpy as np
from dataiku import pandasutils as pdu

import random

columns = ["クラス","番号","科目","得点"]

student_df = pd.DataFrame(columns=columns)

for cls in ["A","B","C"]:
    for id in range(20):
        for sbjct in ["国語","数学","英語"]:
            score = random.randint(0,100)
            student_df=student_df.append(pd.Series([cls, id, sbjct, score], index=columns),ignore_index=True)

student = dataiku.Dataset("student")
student.write_with_schema(student_df)

runを実行すると、クラス、学生番号、科目ごとにテストの得点を記載したデータセットが作られます。

得点の方が整数型ではないので、Integerに変えておきます

あとはChartsタブからグラフを作成しておきます。
今回は、クラスごとの各科目の平均得点を作成してみました

Dashboardsにpublish

早速Dashboarsにグラフを貼り付けていきます。
FLOW画面やデータセットのexplore画面、それからCharts画面等の様々な場所でPUBLISHと書かれたボタンを目にすると思います。
このボタンから、データセットやグラフなどの情報をDashboardsに公開することができます。

PUBLISHボタンを押し、公開するグラフや公開先のDashboardsを選択肢、createします。

すると、Dashboarsに選択したグラフが公開されます。
グラフは大きさなどを自由に変えることができます。

注意点

Dashboardに公開したグラフは、厳密にはデータセットで作成したグラフとは別のものになります。
PUBLISHをしたグラフは、Insightsタイルとして新しく作られます。
Insightsの情報は、Dataiku画面上部のタブからアクセスして確認できます。

そのため、データセットのChartの設定を変更してもDashboardsには反映されないため注意してください。
グラフの設定を変えたい場合には、直接InsightsをEditする必要があります。

その他Dashboardsあれこれ

スライドを分ける

画面下のプラスボタンから新しいスライドを作ることができます。

スライドに名前をつける

スライドにはタイトルをつけられます。
タイトルは閲覧モード(View)時に表示するか指定することができます。

Insightsを直接作る

Publishをせずに、直接InsightsのページからInsightsタイルを作ることもできます。

また、ダッシュボードページからも緑のプラスボタンから新しいタイルを作ることができます。

PDFや画像でエクスポートする

Dataiku上で閲覧するだけではなく、他形式で出力することもできます。

Orientationで縦横も指定できます。

おわりに

簡単にDashboarsの使い方を紹介しました
タイルも様々なタイプがあるようですので、使う人のセンスが問われそうですね。
ぜひお試しください。

参考情報