Deep Learningでリアルタイムにマーケット予測をしてみた

機械学習プロダクト適用におけるリアルを語る会 AlpacaJapan Engineer Keisuke Umezawa Deep Learningでリアルタイムにマーケット予測をしてみた

AlpacaJapan 3 金融 x 機械学習がテーマスタートアップ主な提供サービス/プロダクト ❖ 銀行・証券会社・信託銀行を中心に
金融機関向けトレーディング AI技術で多く実績を保持「相場予測モデル構築」プロジェクトで協業「AlpacaSearch for kabu.com」相互に類似している銘柄チャートパターンを表示「AI外貨予測」「AI外貨積立」指定した外貨為替変動を予測し、予測した日に一定金額を積立可能主要マーケット短期予測をリアルタイムで表示弊社大規模データ処理技術やディープラーニング技術を活用したアプリケーション

AGENDA • 短期マーケット予測紹介とプロダクション適用までつらみ • Alpaca データサイエンスへ取り組み 4

Alpaca Forecast App ブルームバーグと共同リリースしたアプリ • 世界で40万人以上ユーザーを持つブルームバーグ端末で動作するアプリ
• Alpacaが研究開発した最新予測モデル結果をリアルタイムに届けている 6

Alpaca Forecast API 予測結果をアプリでなく、APIで配信するサービス • 大手金融機関システムがシグナルを利用して自動取引す
ることを想定 • アプリで表現できない詳細な情報を渡すことで利益を上げる 7

Alpaca 予測モデル触りだけ • AI・ディープラーニングに向いている大量に発生したデータからパターンを探す作業 •
マーケットにおいて最も大量に発生しているデータなにか、それが Tick • 大量 Tickデータから発生パターンを解析し、どようなパターンが発生したときにプライスが上がるか・下がるかをディープラーニングで学習 8 画像認識向け CNNを時系列解析ネットワークとして拡張ディープニューラルネットワークがマーケット特徴的なTick 発生パターンを解析、予測を出している。画像認識 Tick発生パターン

Kubernetesによる予測システム構成 9 pred pred pred pred pred pred adapter
adapter Bloomberg predictor RDS dispatcher dispatcher api api Bloomberg App pod StatefulSet SQS Deployment DB Access ... marketstore marketstore service dispatch queue USDJPY EURUSD Nikkei batch batch 自社で開発した時系列 DB。 OSSで公開。予測結果を出力。冗長化を保ちながらまんべんなく分散されるように設計。

どこがつらいか 10 pred pred pred pred pred pred adapter
adapter Bloomberg predictor RDS dispatcher dispatcher api api Bloomberg App pod StatefulSet SQS Deployment DB Access ... marketstore marketstore service dispatch queue USDJPY EURUSD Nikkei batch batch

どこがつらいか 11 pred pred pred pred pred pred adapter
adapter Bloomberg predictor RDS dispatcher dispatcher api api Bloomberg App pod StatefulSet SQS Deployment DB Access ... marketstore marketstore service dispatch queue USDJPY EURUSD Nikkei batch batch 勿論ここ！

チームでデータサイエンスを行うと、こんなことありませんか・・・？ • なぜかデータが存在しない・・・ • なぜか環境が再現できない・・・ • なぜか渡されたNotebookが動かない・・・ • なぜかscriptが動かなくなっている・・・
• etc... 12

研究成果をプロダクトに取り込もうとすると、こんなことありませんか・・・？ • そもそもプロダクション環境がない・・・ • 現在プロダクションで稼働するに変更が多すぎる・・・ • 実験で使ったコードを丸々プロダクション
ために書き直さないといけない・・・ • モデル性能を再現できない・・・ • etc... 13

Alpacaデータサイエンスチーム Mission • 諸々課題をどうやって解決するかというと、 15

Alpacaデータサイエンスチーム Mission • 諸々課題をどうやって解決するかというと、 16 エンジニアリング

チームでデータサイエンスを行うために 1. データを共有できるように、 a. DB等でデータを一箇所で管理 b. データパイプラインで更新作業を自動化 2. 環境を共通化できるように、 a.
コンテナによる開発・実験 3. 後々に実験が再現できるように、 a. Test可能な方法で実験を行う b. Notebookによる実験行わない、可視化ためだけに使う 4. 誰でも実験を再現できるように、 a. 前処理・学習・評価を一連パイプラインとして管理 b. 可読なモデルフォーマットによる実験内容管理 17 自社開発

研究成果をすぐにユーザに提供するために 1. プロダクションを大幅に変更しなくても良いように、 a. 共通プラットフォーム Alpaca Forecasting Platform 開発 b.
データサイエンス部分コード共有・ライブラリ化 c. 実験とプロダクションでモデルフォーマット共通化 2. プロダクションで性能を再現できるように、 a. データサイエンス部分コード共有・ライブラリ化 b. 実験とプロダクションでモデルフォーマット共通化 18 自社開発自社開発自社開発自社開発自社開発

共通解決策 1. プロダクションを大幅に変更しなくても良いように、 a. 共通プラットフォーム Alpaca Forecasting Platform
開発 b. データサイエンス部分コード共有・ライブラリ化 c. 実験とプロダクションでモデルフォーマット共通化 2. プロダクションで性能を再現できるように、 a. データサイエンス部分コード共有・ライブラリ化 b. 実験とプロダクションでモデルフォーマット共通化 19 1. データを共有できるように、 a. DB等でデータを一箇所で管理 b. データパイプラインで更新作業を自動化 2. 環境を共通化できるように、 a. コンテナによる開発・実験 3. 後々に実験が再現できるように、 a. Test可能な方法で実験を行う b. Notebookによる実験行わない、可視化ためだけに使う 4. 誰でも実験を再現できるように、 a. 前処理・学習・評価を一連パイプラインとして管理 b. 可読なモデルフォーマットによる実験管理

共通解決策 1. プロダクションを大幅に変更しなくても良いように、 a. 共通プラットフォーム Alpaca Forecasting Platform
開発 b. データサイエンス部分コード共有・ライブラリ化 c. 実験とプロダクションでモデルフォーマット共通化 2. プロダクションで性能を再現できるように、 a. データサイエンス部分コード共有・ライブラリ化 b. 実験とプロダクションでモデルフォーマット共通化 20 1. データを共有できるように、 a. DB等でデータを一箇所で管理 b. データパイプラインで更新作業を自動化 2. 環境を共通化できるように、 a. コンテナによる開発・実験 3. 後々に実験が再現できるように、 a. Test可能な方法で実験を行う b. Notebookによる実験行わない、可視化ためだけに使う 4. 誰でも実験を再現できるように、 a. 前処理・学習・評価を一連パイプラインとして管理 b. 可読なモデルフォーマットによる実験管理 ModelPackage 開発ニーズ

ModelPackage 目的と実装 21 目的 1. 実験とプロダクションで共通フォーマットでモデルを定義する 2. 可読なモデルフォーマットで実験を管理する
実装 1. 実験とプロダクションに必要なインタフェースを定義し、両環境でそれを呼び出す 2. それぞれインタフェース実装をyamlファイルで定義できるようにする

ModelPackage インタフェース ModelPackage 以下を行うインタフェースが提供されている。 • データ前処理 • 正答ラベル
作成 • 推論プロダクションで、データ前処理と推論インタフェースを呼び出すようになっている。新しいモデルをデプロイする時もこインタフェースさえ満たしていれ即時にリリース可能。 22 ModelPackage build_dataset calc_labels predict_with_df

STRICTLY CONFIDENTIAL AND FOR INTERNAL USE ONLY 実験で ModelPackage 使い方
23 Experiments Pipeline Dataset Step Label Step Train Step Prediction Step Pointed function is called by task. ModelPackage build_dataset calc_labels predict_with_df 実験・プロダクションで同じインタフェースを呼び出すことで、同じ動作をすることが保証されている。

ModelPackage 定義ファイルすべて予測モデル ModelPackageというパッケージ形式で管理 • データ前処理 •
正答ラベル作成 • 学習・推論などなど、予測モデルを動作させるすべて情報がyamlファイルで記載され ModelPackage内部で保持ロードされたModelPackage 自分に保存された情報から、自分がどように動作すれいいか一意に決定する 24 例: 特徴量をどように生成するかを YAMLファイルで管理している

ただまだこれでもつらい・・・ • いちいちyamlファイルからモデルへマッピングを書かないといけないなくて、研究自由度が低い ◦ Pythonで処理パイプラインを書いたら、それがモデルとして保存されてほしい
• Pythonでしか動かない ◦ プロダクション環境違う言語を使いたいに、モデルを動かすことを考えるとPythonに限定されてしまう 25

• Pythonでしか動かない ◦ プロダクション環境違う言語を使いたいに、モデルを動かすことを考えるとPythonに限定されてしまう 26 → sklearn Pipeline ようなもでモデルを定義し、それをpickleする？

• Pythonでしか動かない ◦ プロダクション環境違う言語を使いたいに、モデルを動かすことを考えるとPythonに限定されてしまう 27 → sklearn Pipeline ようなもでモデルを定義し、それをpickleする？ → ONNXモデルフォーマットが、sklearnに対応したで、それを使う？

STRICTLY CONFIDENTIAL 28 We're hiring!! https://www.wantedly.com/companies/alpacadb • Web Engineer •
ML Engineer • Data Engineer

Deep Learningでリアルタイムにマーケット予測をしてみた

Deep Learningでリアルタイムにマーケット予測をしてみた

keisuke umezawa

More Decks by keisuke umezawa

Other Decks in Technology

Featured

Transcript

機械学習プロダクト適用におけるリアルを語る会 AlpacaJapan Engineer Keisuke Umezawa Deep Learningでリアルタイムにマーケット予測をしてみた

AlpacaJapan 3 金融 x 機械学習がテーマスタートアップ主な提供サービス/プロダクト ❖ 銀行・証券会社・信託銀行を中心に

AGENDA • 短期マーケット予測紹介とプロダクション適用までつらみ • Alpaca データサイエンスへ取り組み 4

AGENDA • 短期マーケット予測紹介とプロダクション適用までつらみ • Alpaca データサイエンスへ取り組み 5

Alpaca Forecast App ブルームバーグと共同リリースしたアプリ • 世界で40万人以上ユーザーを持つブルームバーグ端末で動作するアプリ

Alpaca Forecast API 予測結果をアプリでなく、APIで配信するサービス • 大手金融機関システムがシグナルを利用して自動取引す

Alpaca 予測モデル触りだけ • AI・ディープラーニングに向いている大量に発生したデータからパターンを探す作業 •

Kubernetesによる予測システム構成 9 pred pred pred pred pred pred adapter

どこがつらいか 10 pred pred pred pred pred pred adapter

どこがつらいか 11 pred pred pred pred pred pred adapter

AGENDA • 短期マーケット予測紹介とプロダクション適用までつらみ • Alpaca データサイエンスへ取り組み 14

Alpacaデータサイエンスチーム Mission • 諸々課題をどうやって解決するかというと、 15

Alpacaデータサイエンスチーム Mission • 諸々課題をどうやって解決するかというと、 16 エンジニアリング

チームでデータサイエンスを行うために 1. データを共有できるように、 a. DB等でデータを一箇所で管理 b. データパイプラインで更新作業を自動化 2. 環境を共通化できるように、 a.

研究成果をすぐにユーザに提供するために 1. プロダクションを大幅に変更しなくても良いように、 a. 共通プラットフォーム Alpaca Forecasting Platform 開発 b.

共通解決策 1. プロダクションを大幅に変更しなくても良いように、 a. 共通プラットフォーム Alpaca Forecasting Platform

共通解決策 1. プロダクションを大幅に変更しなくても良いように、 a. 共通プラットフォーム Alpaca Forecasting Platform

ModelPackage 目的と実装 21 目的 1. 実験とプロダクションで共通フォーマットでモデルを定義する 2. 可読なモデルフォーマットで実験を管理する

ModelPackage インタフェース ModelPackage 以下を行うインタフェースが提供されている。 • データ前処理 • 正答ラベル

STRICTLY CONFIDENTIAL AND FOR INTERNAL USE ONLY 実験で ModelPackage 使い方

ModelPackage 定義ファイルすべて予測モデル ModelPackageというパッケージ形式で管理 • データ前処理 •

ただまだこれでもつらい・・・ • いちいちyamlファイルからモデルへマッピングを書かないといけないなくて、研究自由度が低い ◦ Pythonで処理パイプラインを書いたら、それがモデルとして保存されてほしい

ただまだこれでもつらい・・・ • いちいちyamlファイルからモデルへマッピングを書かないといけないなくて、研究自由度が低い ◦ Pythonで処理パイプラインを書いたら、それがモデルとして保存されてほしい

ただまだこれでもつらい・・・ • いちいちyamlファイルからモデルへマッピングを書かないといけないなくて、研究自由度が低い ◦ Pythonで処理パイプラインを書いたら、それがモデルとして保存されてほしい

STRICTLY CONFIDENTIAL 28 We're hiring!! https://www.wantedly.com/companies/alpacadb • Web Engineer •

Deep Learningでリアルタイムに マーケット予測をしてみた

Deep Learningでリアルタイムに マーケット予測をしてみた

More Decks by keisuke umezawa

Other Decks in Technology

Featured

Transcript

Deep Learningでリアルタイムにマーケット予測をしてみた

Deep Learningでリアルタイムにマーケット予測をしてみた