Deep Learningによる株価変動の予想

Deep Learningによる株価変動の予想

2016年10月12日 GMOエンジニアトークにて公開

8ca514f93117daca13d14c7c87a02d46?s=128

GMO次世代

October 13, 2016
Tweet

Transcript

  1. GMOインターネット 次世代システム研究室

  2. 2 研究の目的 過去のデータを使って、予測を⾏いたい! -> ⾦融商品は良いターゲット 新しい手法の台頭! 従来の手法 時系列解析

  3. 3 Outline 株価データの時系列解析 Deep Learning (LSTM) を使って株価予想 なんでLSTMで予想できるの? Kerasを使ってやってみた まとめ

    & 改善点
  4. 4 時系列解析

  5. 5 S&P 500 NASDAQに上場している銘柄から代表的な 500銘柄の株価を浮動株調整後の時価総額⽐率で 加重平均し、指数化したもの アメリカの代表的な 会社の株価の指標 要するに 時間軸

  6. 6 Volatility (Daily) = 1日の取引中での、値動きの大きさの指標 ~ 1日の変動 (≠ Historical volatility)

    株価を直接予想したいが。。
  7. 7 Volatility of S&P500 Volatility S&P500の 実データ 時間軸 終値 高値

    安値
  8. 8 時系列解析 過去に学び(学習し)、未来を予測しよう 曇り空 (→ これまで、こんな空模様の時は雨が 降ってきたなぁ。) → 午後に雨が振りそうだ! →

    傘を持って⾏こう
  9. 9

  10. 10 機械学習(教師あり学習) input data output data 与えられたデータyに合うように パラメータを学習(人のアナロジー) モデル f(x)

    x f(x) = ax + b f(x) vs y f(x) = 1*x + 7 f(x) = 2.1x + 1.6 input input output output
  11. 11 機械学習(教師あり学習) f(x) = a*x + b f(x) = a*sin(b*x)

    適切なモデルを考える必要がある → 大変!!! (データが増えるほど) モデル モデル
  12. 12 Deep Learning Deep! 複雑な表現 層が input data output data

    モデル f(x) が可能
  13. 13 RNN (Recurrent Neural Network) Deep Learningの一種 横にDeep! 過去の出⼒を⼊⼒ →

    過去を記憶 時系列データに最適(ただし問題点が) 過去データ 私 は 男 で す
  14. 14 LSTM (Long Short Term Memory) 今回の解析で使用

  15. 15 LSTM Block

  16. 16 LSTM 良い点 Deepなnetworkで複雑な表現も可能に インプットに複数のデータを簡単に⼊れ られる 我々が気づかなかった関係性をキャッチ できるかも!

  17. 17 LSTM 悪い点 時間がかかる → 耐えられるレベル 一度、学習すれば速い 結果を理解しづらい 理解する努⼒が必要

  18. 18 Keras 直感的に使える TensorFlow, Theanoをバックエンドで使用 Python コード量が少ない → 初心者に優しい →

    海外で人気
  19. 19 Demo

  20. 20 結果 MAPE (Mean Absolute Percentage Error) = 29.3%

  21. 21 Model構造を変えてみる LSTM IN OUT LSTM IN OUT LSTM MAPE

    = 29.4% MAPE = 29.3%
  22. 22 LSTM IN OUT MAPE = 27.0% LSTM IN OUT

    MAPE = 29.3% linear function
  23. 23 Loss function MAPE MSE MAPE = 29.3% MAPE =

    44.3%
  24. 24 学習回数 学べば学ぶほど 良い! 、、わけではない。 25.0% 過学習?

  25. 25 過学習 過学習 モデルが学習データに適合しすぎて、ノイズま で再現するように学習するため、学習データ以 外のデータ(予想したいデータ)の予測精度が 悪化 → 適切なパラメータ数、学習回数にするこ とが大切

  26. 26 入力データを増やす 自身のデータ以外に株価に影響を与えそ うな情報を追加すれば、より良い予想が できるはず! → LSTMなら簡単に試せる。 今回は、Google Domestic Trends

    (米国内のトピックごとの検索量 ~ 注目度) を採用
  27. 27 Topic: computer, credit card, invest, bankruptcy MAPE = 23.7%

    改善した!
  28. 28

  29. 29 結果の比較 まだ伸びしろはありそう LSTM (Default) LSTM (modified) LSTM (add. info)

    29.3% 25.0% 23.7% → 有望! (モデル修正、パラメータ調整、新しいデータ) モデルごとのMAPE
  30. 30 参考文献 勝った!

  31. 31 今後の方向性 DL(LSTM)は非常に有望。さらに深めたい Busrt(突発的な上下動)を予想したい Keyとなるパラメータ Model構造 ⼊⼒期間の⻑さ (予想に使えそうな)外部データの⼊⼒ 他の⾦融商品も予想してみたい

  32. 32 ご清聴ありがとうございました!