SPSS ModelerのストリームファイルをCP4DのModelerFlowにマイグレーションする


SPSS ModelerのストリームファイルをCP4DのModelerFlowにマイグレーションします。
ほとんどの処理を取り込むことができますが、インポート・ノードとエクスポート・ノードは修正が必要です。

  • テスト環境
    • CP4D 4.0.5

今回は以下のcreditrisk.complete.strというストリームファイルをインポートしてみます。

#1. インプットとアウトプットのデータ資産登録
インポート・ノードとエクスポート・ノードがCSVファイルの場合はUTF-8に変換したうえで、あらかじめプロジェクトのデータ資産としてアップロードしておきます。
なお、RDBのテーブルがインプットやエクスポートの対象である場合は対象のテーブルをデータ資産として登録しておきます。

#2. ストリーム・ファイルのマイグレーション
「プロジェクトに追加」で「Modelerフロー」を選びます。

「ファイルから」を選び、フロー・ファイルのアップロードにcreditrisk.complete.strをドラッグアンドドロップします。うまくいくとファイル名が表示されますので、「作成」でマイグレーションを開始します。

「ノードをマイグレーションしますか?」と聞かれますので、「はい」をクリックします。なお、「いいえ」を選んで個々のノードを付け替えることもできます。

#3. データ資産のマッピング
インポート・ノードのCSVファイルとプロジェクトのデータ資産のマッピングを行います。同名のデータ資産がある場合は自動的にマッピングされます。
データ資産を選びなおす場合は「参照」をクリックして選びなおします。

エクスポートノードのマッピングも同様に行います。

以下のようにマイグレーションができました。

#4. マイグレーションしたストリームの注意点
インポート・ノードでインスタンス化やフィルタリングを行っている場合はスーパーノード化されて、マイグレーションされます。

エクスポート・ノードはマイグレーションされたエクスポート・ノードは設定できる項目が限られていました。特に上書きができませんので、実行するとエラーになってしまいます。

エクスポートを新規に作り直すと以下のように設定項目が増えますので、作り直すことをお勧めします。

#参考URL

Importing an SPSS Modeler stream - IBM Documentation