Slide 4
Slide 4 text
© Recruit Co., Ltd. All Rights Reserved
データ活用の取り組み:モデル学習
• よい性能を達成するためのモデル学習
→ モデル性能向上は収益増加に直結するため盛んに取り組まれている
○ 定額のインセンティブ付与における予算制約を考慮したアップリフトモデリング,
松井諒生, 吉住宗朔, 西村直樹, 小林健, 中田和秀, OR学会2023年春季研究発表会
○ 長期報酬に対する逐次的オフ方策学習,
池田春之介, 吉住宗朔, 西村直樹, 齋藤優太, OR学会2024年春季研究発表会
データ収集
(ルールベースや
一様ランダムなど)
モデル学習
オフ方策評価
(オフラインテスト)
オンラインテストパターン
ごとの混合比決定
オンラインテスト
データ収集
4