Slide 1

Slide 1 text

VAEを用いた株価予測 in Lightning Talk

Slide 2

Slide 2 text

Who is me?  趣味 ➢ 筋トレ、飲酒、音ゲー  研究テーマや研究の興味 ➢ 研究テーマ:深層生成モデル(GAN、VAE) ➢ 興味:蒸留、多腕バンディット問題、ガウス過程、 パーシステントホモロジー 普段は数字とか馬とか生成してますが、美少女を生成したいです Twitter:@maguroIsland

Slide 3

Slide 3 text

なぜChainerの活用事例にわざわざ 株価予測を持ってきたのか 3 ① 公開されているプログラムでCNNを 使っているVAEの実装がなかったため※ (株価予測VAE、βVAE for CIFAR-10 を後程公開します on Google Colab) ② Chainerのコードの書きやすさの恩恵を 最大限に預かり、無事株価予測コンペで 特別賞をいただいたため ③ 僕も 100億円が欲しい ※Chainer公式のexamplesにMLPのVAEはあります 株価予測なのでbi-LSTMように2つの入力を取り扱える ようにしています

Slide 4

Slide 4 text

VAE(Variational Autoencoder)って? 4 ここに 表現を 集約 Chainer v5からの Distributionモジュール が生きてくる

Slide 5

Slide 5 text

VAEって元データを復元するよう訓練するのでは? 5 元のVAEの グラフィカルモデル 次月の株価画像Yを 生成するモデルを設計 = න (, ) = න , = (, ) , = න log − ||() = න (, ) = න , = (, , ) , , = න log − ||()

Slide 6

Slide 6 text

VAEって元データを復元するよう訓練するのでは? 6 , = න log − ||() , , = න log − ||() xをエンコードした潜在変数zを デコードしたらyになるように すればいいだけでは? (ただし、x->yに相関があれば)

Slide 7

Slide 7 text

実験データ 7  入力用データ 当月株価と次月株価のろうそくチャート※の直近3年間の ペア計7222枚  訓練、検証、テストデータ 上記の画像を順に5500枚、800枚、922枚に分離 ※以下の様な株価の終値のアップダウンを記載したチャート

Slide 8

Slide 8 text

実験結果 8  実験結果1 再構成誤差自体は途中から下がらなくなってしまったが、 これはうまくいっていないのだろうか...?

Slide 9

Slide 9 text

実験結果 9  実験結果2 おや?それっぽい画像が出来ているのでは。。。? 実際テストデータ922枚で検証したところ正答率59.76%※ ※目視で月末の株価が月初めに比べて上がったか下がったか の二値分類 当月株価チャート 次月株価チャート 予測次月株価チャート

Slide 10

Slide 10 text

実験結果 10  実験結果3 実際に1000万円分のポートフォリオを作成(2月分) ① 3年間の株価の平均分散を考慮し、3622社->30社 ② VAEを用いて30社->11社 ③ twitterでポジティブネガティブ分析11社->6社 ¥10,000,000 ¥10,419,500 +42万 (4.2%の利益)

Slide 11

Slide 11 text

11 レッツ 100億!!

Slide 12

Slide 12 text

Appendix 12 Q. VAEってなんすか? A. https://qiita.com/kenmatsu4/items/b029d697e9995d93aa24 上記の記事がバチくわしいので見てください! Q. 株はいつ買っていつ売ったもの? A. コンペの日程上2019年2月9日に購入し、2/28に売却です Q. 数式の証明は? A. 上記のVAEの記事の式証明においてp(x)をp(y)とし、どちら も仮定の分布をq(z|x)にすればほぼ同じ形で証明できます Q. コードはどこに上がる? A. 私のGithub上にアップしますが、現在コードの手直しをして いるところなので、少々お待ちください。。。 (私のTwitterでいずれ公開するので、よければフォローよろ しくお願いいたします)