オープンソースマシン学習ツールSQLFlow

1049 ワード

北京QConグローバルソフトウェア開発大会において、アリ金服副CTO胡喜はオープンソース機械学習ツールSQLFlowを正式に発表した.
SQLFlowはデータからモデルまでの研究開発過程を抽象化し、下層のエンジンと自動最適化に協力する.
基礎SQL知識を備えた技術者は大部分の機械学習モデルの訓練と予測任務を完成することができる.
「機械学習」には、豊富な知識が必要です.
1、高等数学、統計学、確率論及びプログラミングなど
2、他の分野で非常に高い知識レベルを維持する必要があります.
これらの厳しい要求により、多くの技術者が機械学習分野の専門家になりにくいため、人工知能産業全体の発展を制約している.
Githubでは、アリの金服がSQLFlowのインストールガイドと迅速な入門を提供しています.
https://github.com/sql-machine-learning/sqlflow
トレーニングモデル
SELECT *
FROM iris.train  --        
TRAIN DNNClassifier --   DNN    
WITH n_classes = 3, hidden_units = [10, 20] --     (        )  hidden layer
COLUMN sepal_length, sepal_width, petal_length, petal_width  --          
LABEL iris.train.class --      label  
INTO sqlflow_models.my_dnn_model;  --    	

訓練したモデルでデータのセットを予測するlabel
SELECT *
FROM iris.test  --           ( sepal_length, sepal_width, petal_length, petal_width    ,  label   )
PREDICT iris.predict.class --     label    
USING sqlflow_models.my_dnn_model; --