教師つき学習を用いた株価予測


はじめに


株価に対する多数の要因の影響は在庫予測を複雑で時間のかかる努力にする.ストックの価格を予測することは、その静止していない性質のために計算的に難しいです、そして、それはニュース見出し、つぶやき、歴史的な傾向、社会的メディアニュースなどの多くの要因に依存します.ウォルマートの店舗などの困難を克服し、在庫の価格を予測するより良い精度を達成する.ランダム森林のような人工知能アルゴリズム,xgブースト(lms),lstm(long short term memory),gru(gate recursive unit)などを開発し,rmse(root mean square error)を株価予測に比較した.データセットはオープンソース時系列データセットであり、約5年の間に9つの異なるセクターの下に該当する88の異なる企業の株価から成ります.

データセットについて:-


データセットは、時系列データであり、アップル、アマゾン、シェブロン社、Sanofi、デュークエネルギー会社、ビザ、アルファベットなどのような88の異なる企業の株価で構成されています.これらの企業は、9種類のカテゴリ、すなわち基本的な材料、消費財、ヘルスケア、サービス、ユーティリティ、コングロマリット、金融、産業財や技術の下に該当する.合計では、データセット内の88ファイルがあり、各ファイルは、日付のような機能で構成され、特定の日にオープンされたときの株式のオープン価格は、期間内の在庫の高い、低価格、株のボリュームと個々の会社の調整された終了価格.出力(または)予測変数は特定の日のための在庫の終値です.

ワークフロー:


ランダムフォレストregressorのような機械学習アルゴリズムを訓練するには、まず、すべてのCSVファイルがロードされ、データフレームに変換され、スケーリングがすべてのデータフレームに対して行われます.MinMaxスケーララーは、データセットの各機能が異なるスケールであるため、すべての機能を正常化するスケーリングのために実装することができます、それは訓練のためのモデルに送信される前に、各機能をスケールすることは非常に重要です.また、データセットは日付機能で構成されますが、これはアルゴリズムによって理解されませんので、DataSetsは日付列を3つの異なる列(年、月、日)に分割することによって前処理されなければなりません.最後に、データセットは、トレーニングとテストデータのために分割されます.

結果:


ランダムフォレストregressorのような機械学習アルゴリズムは,88社のうち79社を対象としており,rmse値は,それらの79社に対し0〜1の範囲であった.79のベストパフォーマンス企業のテストデータのRMSE値は以下の通りです.

ほぼ8社では、ランダムフォレストregressorは予想通りに実行されず、それらの8社のRMSE値は0から10までの範囲であるのに対し、1社はアルゴリズムが不十分になり、RMSE値は750から830の範囲であった.より良くて最悪の実行会社は以下のように示されている.


全体としてrmse値は以下の通りである。



以上のことから、BRK - Aの1社において機械学習がうまく行われていないことは明らかである.

The Python code, Datasets and all other files can be found from the following Link:-
https://github.com/ruthvikraja/Stock-Market-Price-Prediction-using-Supervised-Learning.git

まとめ


この記事では、人工知能は、株式市場の価格について予測を行うために使用されます.株式市場は株式の売買が企業に起こる場所である.この作業で使用されるデータは、時系列データセットであり、データセットに関するセクションで説明されているように、88の異なる企業の株価から成ります.しかし、時間成分が追加情報を追加する一方で、他の多くの予測タスクと比較して処理するのが困難な時系列問題も発生します.本研究では,機械学習ベースと深い学習ベースの2つの方法を提案した.提案した方法が本研究で示したように,アンサンブル学習と共に異なるaiベースのアルゴリズムを用いて予測を行い,異なる方法論の結果を比較した.gruは,精度と処理時間に関して,深い学習ベースの方法より優れていることを示した.また、機械学習ベースの方法は、ほとんどの企業のためにかなりよく実行されますが、それは大きな株価の値になると失敗すると、深い学習方法は、高価格の値を持つ株に実装された結果は、はるかに深い学習方法を使用していた.将来的には、エラー値をさらに低減するために、異なるAIアルゴリズムを実装することができる.