Slide 1

Slide 1 text

GMOインターネット 次世代システム研究室

Slide 2

Slide 2 text

2 研究の目的 過去のデータを使って、予測を⾏いたい! -> ⾦融商品は良いターゲット 新しい手法の台頭! 従来の手法 時系列解析

Slide 3

Slide 3 text

3 Outline 株価データの時系列解析 Deep Learning (LSTM) を使って株価予想 なんでLSTMで予想できるの? Kerasを使ってやってみた まとめ & 改善点

Slide 4

Slide 4 text

4 時系列解析

Slide 5

Slide 5 text

5 S&P 500 NASDAQに上場している銘柄から代表的な 500銘柄の株価を浮動株調整後の時価総額⽐率で 加重平均し、指数化したもの アメリカの代表的な 会社の株価の指標 要するに 時間軸

Slide 6

Slide 6 text

6 Volatility (Daily) = 1日の取引中での、値動きの大きさの指標 ~ 1日の変動 (≠ Historical volatility) 株価を直接予想したいが。。

Slide 7

Slide 7 text

7 Volatility of S&P500 Volatility S&P500の 実データ 時間軸 終値 高値 安値

Slide 8

Slide 8 text

8 時系列解析 過去に学び(学習し)、未来を予測しよう 曇り空 (→ これまで、こんな空模様の時は雨が 降ってきたなぁ。) → 午後に雨が振りそうだ! → 傘を持って⾏こう

Slide 9

Slide 9 text

9

Slide 10

Slide 10 text

10 機械学習(教師あり学習) input data output data 与えられたデータyに合うように パラメータを学習(人のアナロジー) モデル f(x) x f(x) = ax + b f(x) vs y f(x) = 1*x + 7 f(x) = 2.1x + 1.6 input input output output

Slide 11

Slide 11 text

11 機械学習(教師あり学習) f(x) = a*x + b f(x) = a*sin(b*x) 適切なモデルを考える必要がある → 大変!!! (データが増えるほど) モデル モデル

Slide 12

Slide 12 text

12 Deep Learning Deep! 複雑な表現 層が input data output data モデル f(x) が可能

Slide 13

Slide 13 text

13 RNN (Recurrent Neural Network) Deep Learningの一種 横にDeep! 過去の出⼒を⼊⼒ → 過去を記憶 時系列データに最適(ただし問題点が) 過去データ 私 は 男 で す

Slide 14

Slide 14 text

14 LSTM (Long Short Term Memory) 今回の解析で使用

Slide 15

Slide 15 text

15 LSTM Block

Slide 16

Slide 16 text

16 LSTM 良い点 Deepなnetworkで複雑な表現も可能に インプットに複数のデータを簡単に⼊れ られる 我々が気づかなかった関係性をキャッチ できるかも!

Slide 17

Slide 17 text

17 LSTM 悪い点 時間がかかる → 耐えられるレベル 一度、学習すれば速い 結果を理解しづらい 理解する努⼒が必要

Slide 18

Slide 18 text

18 Keras 直感的に使える TensorFlow, Theanoをバックエンドで使用 Python コード量が少ない → 初心者に優しい → 海外で人気

Slide 19

Slide 19 text

19 Demo

Slide 20

Slide 20 text

20 結果 MAPE (Mean Absolute Percentage Error) = 29.3%

Slide 21

Slide 21 text

21 Model構造を変えてみる LSTM IN OUT LSTM IN OUT LSTM MAPE = 29.4% MAPE = 29.3%

Slide 22

Slide 22 text

22 LSTM IN OUT MAPE = 27.0% LSTM IN OUT MAPE = 29.3% linear function

Slide 23

Slide 23 text

23 Loss function MAPE MSE MAPE = 29.3% MAPE = 44.3%

Slide 24

Slide 24 text

24 学習回数 学べば学ぶほど 良い! 、、わけではない。 25.0% 過学習?

Slide 25

Slide 25 text

25 過学習 過学習 モデルが学習データに適合しすぎて、ノイズま で再現するように学習するため、学習データ以 外のデータ(予想したいデータ)の予測精度が 悪化 → 適切なパラメータ数、学習回数にするこ とが大切

Slide 26

Slide 26 text

26 入力データを増やす 自身のデータ以外に株価に影響を与えそ うな情報を追加すれば、より良い予想が できるはず! → LSTMなら簡単に試せる。 今回は、Google Domestic Trends (米国内のトピックごとの検索量 ~ 注目度) を採用

Slide 27

Slide 27 text

27 Topic: computer, credit card, invest, bankruptcy MAPE = 23.7% 改善した!

Slide 28

Slide 28 text

28

Slide 29

Slide 29 text

29 結果の比較 まだ伸びしろはありそう LSTM (Default) LSTM (modified) LSTM (add. info) 29.3% 25.0% 23.7% → 有望! (モデル修正、パラメータ調整、新しいデータ) モデルごとのMAPE

Slide 30

Slide 30 text

30 参考文献 勝った!

Slide 31

Slide 31 text

31 今後の方向性 DL(LSTM)は非常に有望。さらに深めたい Busrt(突発的な上下動)を予想したい Keyとなるパラメータ Model構造 ⼊⼒期間の⻑さ (予想に使えそうな)外部データの⼊⼒ 他の⾦融商品も予想してみたい

Slide 32

Slide 32 text

32 ご清聴ありがとうございました!