Slide 12
Slide 12 text
最良の予測モデルは最適な意思決定を導くのか?
12
数値実験1
真のモデル
Masuda & Ikegai (2024)
避難有無・時間・場所の選択を
Discounted RLモデルで表現
𝑥!
: ⾃宅浸⽔深、元の避難意向
𝑎!
: 避難訓練、ハザードマップ
𝑦!
: 避難の有無
𝒟 = 𝑥!, 𝑎!, 𝑦! !"#
$
データ⽣成
学習
14種の⾏動モデル
MNL(2次の交互作⽤あり/なし),
ランダムフォレスト (深さ5, 10),
サポートベクタマシン (線形, ガウス),
k近傍法 (近傍3, 5),
ニューラルネットワーク (1層、2層),
LightGBM (深さ上限なし、上限10),
決定⽊ (深さ5, 10)
推定された最適⽅策
𝑎 = argmax%"∈+
.
𝑞(𝑥, 𝑎,)
⽅策学習
⽅策学習
真の最適⽅策
𝑎 = argmax%"∈+
.
𝑞(𝑥, 𝑎,)
意思決定の最適性を確認
各個⼈への情報提供3種類
予測精度を確認
1000データ