Deep Learningによる株価変動の予想
by
GMO次世代
×
Copy
Open
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
GMOインターネット 次世代システム研究室
Slide 2
Slide 2 text
2 研究の目的 過去のデータを使って、予測を⾏いたい! -> ⾦融商品は良いターゲット 新しい手法の台頭! 従来の手法 時系列解析
Slide 3
Slide 3 text
3 Outline 株価データの時系列解析 Deep Learning (LSTM) を使って株価予想 なんでLSTMで予想できるの? Kerasを使ってやってみた まとめ & 改善点
Slide 4
Slide 4 text
4 時系列解析
Slide 5
Slide 5 text
5 S&P 500 NASDAQに上場している銘柄から代表的な 500銘柄の株価を浮動株調整後の時価総額⽐率で 加重平均し、指数化したもの アメリカの代表的な 会社の株価の指標 要するに 時間軸
Slide 6
Slide 6 text
6 Volatility (Daily) = 1日の取引中での、値動きの大きさの指標 ~ 1日の変動 (≠ Historical volatility) 株価を直接予想したいが。。
Slide 7
Slide 7 text
7 Volatility of S&P500 Volatility S&P500の 実データ 時間軸 終値 高値 安値
Slide 8
Slide 8 text
8 時系列解析 過去に学び(学習し)、未来を予測しよう 曇り空 (→ これまで、こんな空模様の時は雨が 降ってきたなぁ。) → 午後に雨が振りそうだ! → 傘を持って⾏こう
Slide 9
Slide 9 text
9
Slide 10
Slide 10 text
10 機械学習(教師あり学習) input data output data 与えられたデータyに合うように パラメータを学習(人のアナロジー) モデル f(x) x f(x) = ax + b f(x) vs y f(x) = 1*x + 7 f(x) = 2.1x + 1.6 input input output output
Slide 11
Slide 11 text
11 機械学習(教師あり学習) f(x) = a*x + b f(x) = a*sin(b*x) 適切なモデルを考える必要がある → 大変!!! (データが増えるほど) モデル モデル
Slide 12
Slide 12 text
12 Deep Learning Deep! 複雑な表現 層が input data output data モデル f(x) が可能
Slide 13
Slide 13 text
13 RNN (Recurrent Neural Network) Deep Learningの一種 横にDeep! 過去の出⼒を⼊⼒ → 過去を記憶 時系列データに最適(ただし問題点が) 過去データ 私 は 男 で す
Slide 14
Slide 14 text
14 LSTM (Long Short Term Memory) 今回の解析で使用
Slide 15
Slide 15 text
15 LSTM Block
Slide 16
Slide 16 text
16 LSTM 良い点 Deepなnetworkで複雑な表現も可能に インプットに複数のデータを簡単に⼊れ られる 我々が気づかなかった関係性をキャッチ できるかも!
Slide 17
Slide 17 text
17 LSTM 悪い点 時間がかかる → 耐えられるレベル 一度、学習すれば速い 結果を理解しづらい 理解する努⼒が必要
Slide 18
Slide 18 text
18 Keras 直感的に使える TensorFlow, Theanoをバックエンドで使用 Python コード量が少ない → 初心者に優しい → 海外で人気
Slide 19
Slide 19 text
19 Demo
Slide 20
Slide 20 text
20 結果 MAPE (Mean Absolute Percentage Error) = 29.3%
Slide 21
Slide 21 text
21 Model構造を変えてみる LSTM IN OUT LSTM IN OUT LSTM MAPE = 29.4% MAPE = 29.3%
Slide 22
Slide 22 text
22 LSTM IN OUT MAPE = 27.0% LSTM IN OUT MAPE = 29.3% linear function
Slide 23
Slide 23 text
23 Loss function MAPE MSE MAPE = 29.3% MAPE = 44.3%
Slide 24
Slide 24 text
24 学習回数 学べば学ぶほど 良い! 、、わけではない。 25.0% 過学習?
Slide 25
Slide 25 text
25 過学習 過学習 モデルが学習データに適合しすぎて、ノイズま で再現するように学習するため、学習データ以 外のデータ(予想したいデータ)の予測精度が 悪化 → 適切なパラメータ数、学習回数にするこ とが大切
Slide 26
Slide 26 text
26 入力データを増やす 自身のデータ以外に株価に影響を与えそ うな情報を追加すれば、より良い予想が できるはず! → LSTMなら簡単に試せる。 今回は、Google Domestic Trends (米国内のトピックごとの検索量 ~ 注目度) を採用
Slide 27
Slide 27 text
27 Topic: computer, credit card, invest, bankruptcy MAPE = 23.7% 改善した!
Slide 28
Slide 28 text
28
Slide 29
Slide 29 text
29 結果の比較 まだ伸びしろはありそう LSTM (Default) LSTM (modified) LSTM (add. info) 29.3% 25.0% 23.7% → 有望! (モデル修正、パラメータ調整、新しいデータ) モデルごとのMAPE
Slide 30
Slide 30 text
30 参考文献 勝った!
Slide 31
Slide 31 text
31 今後の方向性 DL(LSTM)は非常に有望。さらに深めたい Busrt(突発的な上下動)を予想したい Keyとなるパラメータ Model構造 ⼊⼒期間の⻑さ (予想に使えそうな)外部データの⼊⼒ 他の⾦融商品も予想してみたい
Slide 32
Slide 32 text
32 ご清聴ありがとうございました!