Deep Learningによる株価変動の予想

by GMO次世代

Slide 1

Slide 1 text

GMOインターネット次世代システム研究室

Slide 2

Slide 2 text

2 研究の目的過去のデータを使って、予測を⾏いたい！ -> ⾦融商品は良いターゲット新しい手法の台頭！従来の手法時系列解析

Slide 3

Slide 3 text

3 Outline 株価データの時系列解析 Deep Learning (LSTM) を使って株価予想なんでLSTMで予想できるの？ Kerasを使ってやってみたまとめ & 改善点

Slide 4

Slide 4 text

4 時系列解析

Slide 5

Slide 5 text

5 S&P 500 NASDAQに上場している銘柄から代表的な 500銘柄の株価を浮動株調整後の時価総額⽐率で加重平均し、指数化したものアメリカの代表的な会社の株価の指標要するに時間軸

Slide 6

Slide 6 text

6 Volatility (Daily) = 1日の取引中での、値動きの大きさの指標 ~ 1日の変動 (≠ Historical volatility) 株価を直接予想したいが。。

Slide 7

Slide 7 text

7 Volatility of S&P500 Volatility S&P500の実データ時間軸終値高値安値

Slide 8

Slide 8 text

8 時系列解析過去に学び（学習し）、未来を予測しよう曇り空 (→ これまで、こんな空模様の時は雨が降ってきたなぁ。) → 午後に雨が振りそうだ！ → 傘を持って⾏こう

Slide 9

Slide 9 text

Slide 10

Slide 10 text

10 機械学習(教師あり学習) input data output data 与えられたデータyに合うようにパラメータを学習(人のアナロジー) モデル f(x) x f(x) = ax + b f(x) vs y f(x) = 1*x + 7 f(x) = 2.1x + 1.6 input input output output

Slide 11

Slide 11 text

11 機械学習(教師あり学習) f(x) = a*x + b f(x) = a*sin(b*x) 適切なモデルを考える必要がある → 大変!!! (データが増えるほど) モデルモデル

Slide 12

Slide 12 text

12 Deep Learning Deep! 複雑な表現層が input data output data モデル f(x) が可能

Slide 13

Slide 13 text

13 RNN (Recurrent Neural Network) Deep Learningの一種横にDeep! 過去の出⼒を⼊⼒ → 過去を記憶時系列データに最適（ただし問題点が）過去データ私は男です

Slide 14

Slide 14 text

14 LSTM (Long Short Term Memory) 今回の解析で使用

Slide 15

Slide 15 text

15 LSTM Block

Slide 16

Slide 16 text

16 LSTM 良い点 Deepなnetworkで複雑な表現も可能にインプットに複数のデータを簡単に⼊れられる我々が気づかなかった関係性をキャッチできるかも！

Slide 17

Slide 17 text

17 LSTM 悪い点時間がかかる → 耐えられるレベル一度、学習すれば速い結果を理解しづらい理解する努⼒が必要

Slide 18

Slide 18 text

18 Keras 直感的に使える TensorFlow, Theanoをバックエンドで使用 Python コード量が少ない → 初心者に優しい → 海外で人気

Slide 19

Slide 19 text

19 Demo

Slide 20

Slide 20 text

20 結果 MAPE (Mean Absolute Percentage Error) = 29.3%

Slide 21

Slide 21 text

21 Model構造を変えてみる LSTM IN OUT LSTM IN OUT LSTM MAPE = 29.4% MAPE = 29.3%

Slide 22

Slide 22 text

22 LSTM IN OUT MAPE = 27.0% LSTM IN OUT MAPE = 29.3% linear function

Slide 23

Slide 23 text

23 Loss function MAPE MSE MAPE = 29.3% MAPE = 44.3%

Slide 24

Slide 24 text

24 学習回数学べば学ぶほど良い！、、わけではない。 25.0% 過学習?

Slide 25

Slide 25 text

25 過学習過学習モデルが学習データに適合しすぎて、ノイズまで再現するように学習するため、学習データ以外のデータ（予想したいデータ）の予測精度が悪化 → 適切なパラメータ数、学習回数にすることが大切

Slide 26

Slide 26 text

26 入力データを増やす自身のデータ以外に株価に影響を与えそうな情報を追加すれば、より良い予想ができるはず！ → LSTMなら簡単に試せる。今回は、Google Domestic Trends （米国内のトピックごとの検索量 ~ 注目度）を採用

Slide 27

Slide 27 text

27 Topic: computer, credit card, invest, bankruptcy MAPE = 23.7% 改善した！

Slide 28

Slide 28 text

Slide 29

Slide 29 text

29 結果の比較まだ伸びしろはありそう LSTM (Default) LSTM (modified) LSTM (add. info) 29.3% 25.0% 23.7% → 有望！ (モデル修正、パラメータ調整、新しいデータ) モデルごとのMAPE

Slide 30

Slide 30 text

30 参考文献勝った！

Slide 31

Slide 31 text

31 今後の方向性 DL(LSTM)は非常に有望。さらに深めたい Busrt(突発的な上下動)を予想したい Keyとなるパラメータ Model構造⼊⼒期間の⻑さ（予想に使えそうな）外部データの⼊⼒他の⾦融商品も予想してみたい

Slide 32

Slide 32 text

32 ご清聴ありがとうございました！