KDD2021読み会

マーケット + 他の株からの相互作用を考慮した株価予測 Accurate Multivariate Stock Movement Prediction via Data-Axis
Transformer with Multi-Level Contexts 多重解像度の過去データを入力にして天候予測 Micro-climate Prediction - Multi Scale Encoder-decoder based Deep Learning Framework 強化学習で直接点差が小さくなるオンラインゲームマッチシステムを作る Globally Optimized Matchmaking in Online Games KDD2021読み会

Accurate Multivariate Stock Movement Prediction via Data-Axis Transformer with Multi-Level
Contexts 一言で: マーケット + 他の株からの相互作用を考慮した株価予測超シンプルに、 • 過去の市場全体の株価リストを入力にして • 翌日株価が上がるかどうかを当てるもっとたくさんやられてる問題だと思った

過去の株価変動をLSTMで吸収マーケット指標モデルとそれぞれ結合銘柄同士の相互作用上がるか下がるか

投資シミュレーション各国のデータを使ってこのシステムを使った場合の投資シミュレーション(毎日予測値top3にリバランスするというシンプルなもの) 既存手法は突然大失敗する日がある -> 株価同士・マーケットとの相
対的な値を見ていないからだと説明(負けてるときに頑張ってる株が評価されない？)

Micro-climate Prediction - Multi Scale Encoder-decoder based Deep Learning Framework
一言で: 多重解像度の過去データを入力にして天候予測 Microsoft Research Azure Farmbeatsという農業用センサデータ可視化platformがある -> このデータを元に局所的な天候予測

解像度ごとのモデル (ちなみにlong scaleはこの時点でもLSTMをかませる) 複数レベルのWaveletを用いて多重解像度の時間周波数画像を得る

複数時間解像度の混合モデルであることで、バースト的な値にも綺麗に追従

Globally Optimized Matchmaking in Online Games 一言で: 強化学習で直接点差が小さくなるオンラインゲームマッチシステムを作る Netease社 Fuxi
AI Lab

既存のオンラインマッチは 1. ユーザー単位のElo ratingなどをつける 2. いまいるプレイヤーの中から、 Elo ratingが近いプレイヤーを分ける感じでgreedyに2チーム
にするあくまでもbyユーザーのスコアの上での最適化

マッチしてみないといいマッチかわからない報酬が疎な問題 -> 強化学習で解こう  TeamAとTeamBにすでに選ばれたメンバー  残りの人から次に誰をTeamAまたはBにいれるか  ドラフト方式  マッチ毎に決まるものなら自由だが、例えば点差 

テクニックプレイヤーの特徴量はもちろんゲームによって異なるし、ドメインエキスパートが設計リリース時にハチャメチャな挙動をしないように、オフライン事前学習 * 1. すでに行われたマッチ結果を使って疑似報酬関数を作る * (TeamA, TeamB)
-> 予想点差モデル * 2. ↑の報酬関数を最大化するように一旦オフラインで強化学習 * 3. 最終的にリリースして実点差を使ってfine-tune

結果ところで、Netease Fuxi AI LabはよくFeverBasketballを使ってるようで、強化学習で FeverBasketをやるエージェントも公開してる https://github.com/FuxiRL/FeverBasketball 実環境にデプロイしての効果検証 (100,000試合以上)
Original(ゲーム内の実実装)よりも点差が小さくなった

KDD2021読み会

KDD2021読み会

Keisuke OGAKI

More Decks by Keisuke OGAKI

Other Decks in Technology

Featured

Transcript

マーケット + 他の株からの相互作用を考慮した株価予測 Accurate Multivariate Stock Movement Prediction via Data-Axis

Accurate Multivariate Stock Movement Prediction via Data-Axis Transformer with Multi-Level

過去の株価変動をLSTMで吸収マーケット指標モデルとそれぞれ結合銘柄同士の相互作用上がるか下がるか

投資シミュレーション各国のデータを使ってこのシステムを使った場合の投資シミュレーション(毎日予測値top3にリバランスするというシンプルなもの) 既存手法は突然大失敗する日がある -> 株価同士・マーケットとの相

Micro-climate Prediction - Multi Scale Encoder-decoder based Deep Learning Framework

解像度ごとのモデル (ちなみにlong scaleはこの時点でもLSTMをかませる) 複数レベルのWaveletを用いて多重解像度の時間周波数画像を得る

複数時間解像度の混合モデルであることで、バースト的な値にも綺麗に追従

Globally Optimized Matchmaking in Online Games 一言で: 強化学習で直接点差が小さくなるオンラインゲームマッチシステムを作る Netease社 Fuxi

既存のオンラインマッチは 1. ユーザー単位のElo ratingなどをつける 2. いまいるプレイヤーの中から、 Elo ratingが近いプレイヤーを分ける感じでgreedyに2チーム

結果ところで、Netease Fuxi AI LabはよくFeverBasketballを使ってるようで、強化学習で FeverBasketをやるエージェントも公開してる https://github.com/FuxiRL/FeverBasketball 実環境にデプロイしての効果検証 (100,000試合以上)