Slide 20
Slide 20 text
© 2025 oneroots inc.
[実験②] Contextual Bandit によるレコメンド
20
アプローチ概要
● 新しい棚の特性を素早く学習 し、適切な位置に表示 することが必要
→ “探索” と “活用” のバランスが重要
→ バンディットアルゴリズム をベースとしたレコメンデーションを調査
● 最もユースケースが近い音楽ストリーミングアプリの事例
(Carousel Personalization in Music Streaming Apps with Contextual Bandits , RecSys 2020)
を参考にモデリング
○ ユーザの行動履歴や属性で作ったベクトルから各棚のCTRを予測
○ Cascade-based なモデル更新が特徴
■ クリックした棚を正例、クリックした棚よりも上位にある棚を負例 とする
■ ユーザへの棚の表示有無が取得できない今回のケースにマッチ