Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2023/03/04 sigfin30: 原資産価格過程不要な敵対的Deep Hedging

2023/03/04 sigfin30: 原資産価格過程不要な敵対的Deep Hedging

平野正徳, 南賢太郎, 今城健太郎,
"原資産価格過程不要な敵対的Deep Hedging,"
人工知能学会第30回金融情報学研究会(SIG-FIN), 2023/03/04
https://doi.org/10.11517/jsaisigtwo.2023.FIN-030_51

Masanori HIRANO

March 04, 2023
Tweet

More Decks by Masanori HIRANO

Other Decks in Technology

Transcript

  1. 原資産価格過程不要な 敵対的 Deep Hedging 平野 正徳1,南 賢太郎2,今城 健太郎2 1 The

    University of Tokyo 2 Preferred Networks, Inc. 第30回 人工知能学会 金融情報学研究会 (SIG-FIN)
  2. Deep Hedgingとは?  深層学習を用いて,デリバティブのヘッジ戦略をたてる  CVaR (Expected shortfall)などの効用関数に基づいた効用最大化問題 2 NNによる

    ヘッジ 最終的な Profit & Loss (PL) CVaRなどの 効用関数 最大化 誤差逆伝播 誤差逆伝播 Buehler, H., Gonon, L., Teichmann, J., & Wood, B. (2019). Deep hedging. Quantitative Finance, 19(8), 1271–1291.
  3. Deep Hedgingの強み 3 Deep Hedging 他の主要な手法 タスク設定 執行問題 価格・Greeks予測 出力

    ヘッジポジション 価格・Greeks アプローチ 強化学習的 予測問題 目的関数 PLの効用 予測誤差 手数料(frictions) あり なし 価格付けモデル 不要 Black-Scholes 想定市場 不完全市場 完全市場 より現実的な問題設定!
  4. Deep Hedgingにおける原資産価格過程 4 Simulatorによる 価格時系列 (+ 過去データ) 実データ (1 pathしかない)

    Deep Hedging 学習 適用 どうやって決める? 幾何ブラウン運動,Heston Model,Rough Volatility,Marton Jump Process, Neural ODE,Neural SDE,… どれを使えば一番いいのかわからない…
  5. Deep Hedgingにおける原資産価格過程 5 Simulatorによる 価格時系列 (+ 過去データ) 実データ (1 pathしかない)

    学習 適用 実データからモデリング(パラメータ決定)するのは, ある種のリークではないか? Deep Hedging
  6. 提案手法:敵対的 Deep Hedging 6 学習 Hedger (Deep Hedging) Generator 生成

    効用 (ERM, CVaR) 効用最大化を目指す 効用最小化を目指す  GeneratorとHedgerのmin maxゲームとして定式化できる = 敵対的  Hedgerは無リスクリターンの獲得を学びうるので,Generatorはその対策を学習する  結果としてGeneratorはランダムに近い価格時系列を生成する  必ずしも現実に近い価格時系列がHedgerの学習に良いわけではない
  7. 提案手法の実装:Generator  Layer Normalization, Spectral Normalizationを適用  リターンは,バッチ内平均0となる正規化制約を追加(ある種の帰納バイアス)  効用関数がCVaR90%などの場合には,Generatorの学習時には単純平均を効用関

    数に利用 8 RNN Cell RNN Cell 100次元の 乱数 10次元の 乱数 10次元の 乱数 RNN Cell 10次元の 乱数 時刻 𝑡𝑡1 のリターン 時刻 𝑡𝑡2 のリターン 時刻 𝑡𝑡3 のリターン FC Layer
  8. 提案手法の実装:Hedger  Hedgerは4層のMLP.32次元のノード.  Layer Normalization,Spectral Normalizationを適用  比較手法のモデルでもHedgerは同じものを使用 9

    Hedger 時刻 𝑡𝑡の原資産価格 時刻 𝑡𝑡での有用な情報 (今回はBlack Sholes Delta) 前ステップのポジション 新しいポジション
  9. 実験  比較モデル: ◦ Proposed:敵対的 Deep Hedging ◦ Brownian:通常のDeep Hedging

    + 幾何ブラウン運動による原資産価格過程 ◦ Heston:通常のDeep Hedging + Heston Modelによる原資産価格過程  対象:4パターン ◦ オプション 2種: European Option / Lookback Option ◦ 効用関数 2種: Entropic Risk Measure (ERM) / CVaR 90% (CVaR)  評価用バックテスト(Close-Closeテスト)のデータ: ◦ S&P 500: S&P500の2000/1~2022/8のDaily data ◦ S&P 500 (old): S&P500の1931/1~1950/12のDaily data ◦ BVSP: ブラジル株価指数Bovespa (BVSP)の2000/1~2022/8のDaily data 10
  10. ヘッジ結果のPL (抜粋)  Brownianと提案手法の比較(ここでは2パターンのみ) 11 European Option + ERM S&P

    500 back test Lookback Option + CVaR S&P 500 back test きれいにPLを再現 PLが正の部分が顕著 =利益を獲得しやすい
  11. まとめと考察  原資産価格過程を仮定せずともDeep Hedgingの学習に成功 ◦ 必ずしもパフォーマンスが良いわけではないが,従来のDeep Hedgingと同等程 度のPL分布を再現  原資産価格過程に一定の過程を仮定することはバイアスを発生させかねな

    い ◦ モデルフリーで敵対的に学習することでバイアスを回避 ◦ 提案手法の方がロバストである可能性  原資産価格過程のキャリブレーションが不要に ◦ キャリブレーション自体がoverfittingを発生させる可能性もある  敵対的に学習することで,Hedge学習にとってより重要な部分のみを学習で きている可能性  今後の課題として,性能向上や理論解析など 13
  12. Thank you for your attention! Any Question? Contact: [email protected] HP:

    https://mhirano.jp Copyright © 2023 Preferred Networks, Inc. All Right Reserved.