Bakery and weather data を使用して、天気と売れ筋商品TOP3をSPSS Modelerで見てみた。(その3 - 天気で売れ筋商品に違いが出てくるか確認)


はじめに

この記事は、IBMのサンプルデータをSPSS Modelerを使って読み解いていこうというものです。今回は連載3回目となります。この回では、天気で売れ筋商品に違いが出てくるか確認していきたいと思います。

シリーズ目次

1. 天気別にデータを抽出(条件抽出ノード)

条件抽出ノードを使って、天気別に売上を上位から見ていきたいと思います。

1-1. 条件抽出ノードを使うまでの下準備

これまで、使ってきた可変長ファイルノード、レコード集計ノード、ソートノードを使って、条件抽出ノードを使うまでの下準備をします。

初めに、「Bakery and weather data.csv」を、 SPSS Modelerのストリーム領域にドラッグ&ドロップして追加します。(可変長ファイルノード)

次に、レコード集計ノードをストリーム領域にドラッグ&ドロップして追加します。

可変長ファイルノードとレコード集計ノードを矢印で繋ぎます。

レコード集計ノードをダブルクリックして設定画面を開き、「キーフィールド」にWeatherとProduct、「集計フィールド」で合計にチェック、「フィールドにレコード度数を含める」にチェックを入れます。「OK」をクリックします。

次に、ソートノードをストリーム領域にドラッグ&ドロップして、レコード集計ノードから矢印で繋ぎます。

ソートノードをダブルクリックして設定画面を開き、「Sales in USD_Sum」を降順に設定して、「OK」をクリックします。

ここまでで、条件抽出ノードを使う準備ができました。ちなみに、この状態でレコードがどうなっているか知りたいときは、テーブルノードをストリーム領域に追加して、ソートノードから矢印で繋ぎ、テーブルノード上で「実行」します。

天候データが混ざった状態でデータが表示されています。

2. 天気で売れ筋商品に違いが出てくるか確認する。

2-1. 条件抽出ノードを使って、任意のデータを抽出する。

条件抽出ノードをストリーム領域にドラッグ&ドロップして、ソートノードから矢印で繋ぎます。

条件抽出ノードをダブルクリックして設定画面を開き、「モード」を含めるに設定して、「条件」で「Weather = "Sunny"」と記載し、「OK」をクリックします。

※同様の手順で、Cloudy , Rainy, Snowy 分の条件抽出ノードを追加します。

最後に、テーブルノードをストリーム領域にそれぞれ追加し、各条件抽出ノードから矢印で繋ぎます。

各テーブルノードに「レコードの強調表示」というものがあるので「@INDEX <= 3」を設定しておくと見やすいです。

条件抽出ノードで設定した全てのストリームを一度に実行します。ツールバーの三角マーク(現在のストリームを実行(このストリーム領域にある全てのストリーム))をクリックします。

4つの結果を得ることができます。

3. まとめ

4つの天候の売上TOP3商品を確認したところ、どの天候でも 売上こそ違うものの、
🏆 Red Velvet Cupcake
🏆 Cold Brew Coffee
🏆 Light Roast Coffee
ばかり売れていますね。コーヒーとカップケーキの有名店なのでしょうか・・

Sunny以外の天候でも足を運んでもらえるようにするには、この強みを活かして、カップケーキ雨の日割引などした方がいいのでしょうかね。

きょうのおやつはカップケーキ(できるだけ赤いやつ!)とブラックコーヒーをいただきたくなってしまいました。

あまり結果に違いはありませんでいたが、ここまでお付き合いいただきありがとうございました。