Upgrade to Pro — share decks privately, control downloads, hide ads and more …

"多様な推薦"はユーザーの目にどう映るか

kuri8ive
June 15, 2024

 "多様な推薦"はユーザーの目にどう映るか

IR Reading 2024春での発表資料です。
https://sigir.jp/post/2024-06-15-irreading_2024spring/

紹介した論文はUser Perceptions of Diversity in Recommender Systems (UMAP2024)です。
https://www.ksi.mff.cuni.cz/~peska/vyuka/ndbi021/2024_labs/semestral_work/UMAP_preprint.pdf

kuri8ive

June 15, 2024
Tweet

More Decks by kuri8ive

Other Decks in Research

Transcript

  1. IR Reading 2024春 2024年6月15日 "多様な推薦"はユーザーの目にどう映るか User Perceptions of Diversity in

    Recommender Systems (UMAP2024) LINEヤフー株式会社 栗本 真太郎(@kuri8ive) ※ 断りのない限り、図表は紹介論文からの引用です
  2. 5/18 データセット l 映画:MovieLens Tag Genome 2021[12] l アイテム数1万6000、ユーザー数18万、評価数510万、2021年公開 l

    非常に古い映画、長いことアクセスしていないユーザー、評価がほとんどない映画は削除 l 本:GoodBooks-10k[30] l アイテム数6500、ユーザー数5万3000、評価数460万、2017年公開 l ジャンル情報は1書籍に1つ カバー画像、要約、主要書籍ジャンルなどをIMDb.comとGoodReads.comから収集し紐付け このデータから後述の方法で多様化した推薦結果を作成し、実験で用いる [12] Revisiting the tag relevance prediction problem. (SIGIR, 2021) [30] Goodbooks-10k: a new dataset for book recommendations. (FastML, 2017)
  3. 6/18 l 𝑢, 𝑣: ユーザー l 𝑖, 𝑗: アイテム l

    𝑈, 𝐼: 全ユーザー、全アイテム l 𝐶 ⊂ 𝐼: 利用可能なアイテム集合 l 𝐿: 推薦リスト l r!,# ∈ 𝑅: ユーザーによる評価 l ̂ 𝑟!,# : 推定される関連性 l 𝑑(𝑖, 𝑗), 𝑑(𝐿): アイテム𝑖, 𝑗の多様性、リスト𝐿の多様性 記法
  4. 8/18 評価する多様性指標の選出(1/3)|前提と大まかなグループ 前提:リスト内の多様性(ILD)で考える 𝑑!"# 𝐿 = ∑$,& ∈";$ )& 𝑑(𝑖,

    𝑗) 𝐿 ∗ |𝐿 − 1| l 協調フィルタリングベースの多様性(CF) l 評価値行列や協調フィルタリングで学習されたアイテム埋め込みを使うもの l メタデータベースの多様性(MD) l ジャンルやタグを使うもの l コンテンツベースの多様性(CB) l 映画や本の要約文章を使うもの
  5. 9/18 評価する多様性指標の選出(2/3)|選出基準 l 概念的多様性 l 理想的には、CF、MD、およびCBグループからそれぞれ代表を選ぶこと l 新規性とカバレッジ l 革新的な指標や最近あまり実験されていない指標を優先すること

    l パフォーマンスの多様性 l 事前調査のオフライン評価で非常に類似した動作を示す指標は含まないこと l SAN値チェック l テストケースにおいて、合理的な順序付けを提供する場合にのみ指標を含むこと
  6. 10/18 評価する多様性指標の選出(3/3)|選出された指標 l 協調フィルタリングベースの多様性(CF):CF-raw-ILD l 評価値行列に基づくアイテム𝑖, 𝑗のコサイン距離を使う l メタデータベースの多様性(MD):MD-genres-BinDev l

    推薦リストの各アイテムに割り当てられたジャンルに基づく二項多様性[25]を使う 二項多様性は、ジャンルのカバレッジとリスト内の非冗長性の二つの成分の積として定義 l コンテンツベースの多様性(CB):CB-plot-ILD l CLIP[18]で映画や本の要約から得た埋め込みを使う (※ その他変種も一部実験では使われているが、本スライドでは説明を割愛) [25] Coverage, redundancy and size-awareness in genre diversity for recommender systems. (RecSys, 2014) [18] Learning transferable visual models from natural language supervision. (ICML, 2021)
  7. 11/18 実験の流れ(1/2)|EasyStudyフレームワーク[8]に準じて実施 [8] Coverage, redundancy and size-awareness in genre diversity

    for recommender systems. (RecSys, 2014) 1. 事前アンケート l ドメイン理解度、推薦システムの知識、 "多様な推薦"に関する認識 2. 嗜好の引き出し l 人気度、新規性、多様性に基づいて サンプリングされたアイテムを提示し、 消費した/好きなものを 最低5つ選んでもらう 3. 最も多様だと感じる指標の選出 (→RQ1) l CF, MD, CBそれぞれの多様性指標に 基づいて多様化された 8アイテムずつの推薦リスト3つを提示し、 最も多様だと感じるものを選んでもらう
  8. 12/18 実験の流れ(2/2)|EasyStudyフレームワーク[8]に準じて実施 4. 多様化度合いの評価(→RQ2) l 特定の多様性指標に基づき ランダムに選ばれた多様化閾値 𝛼 ∈ {0.0,

    0.01, 0.1, 0.25, 0.5, 0.75, 0.9, 0.99, 1.0} で生成された3つの推薦リストで 最も多様に見えるものを 選んでもらう * 2回 上記4手順をProlificで募った216人に実施 (MovieLens111人、GoodBooks105人)
  9. 14/18 RQ2|多様化度合いの差はどの程度認識されるのか?(1/2) 多様化度合いの評価における、各リストの3つの判断を考慮 l 絶対判断: 各リストのドロップ位置をそのまま多様化度合いの認識とする l 相対判断: 2つのリストの位置の違いを多様化度合いの差の認識とする l

    相対2値判断: より多様化度合いの高いリストを多様だと認識したか また、多様化閾値αを以下のクラスターに分割 l 0.0, 0.01, 0.1 : 低多様化 l 0.25, 0.5, 0.75 : 中多様化 l 0.9, 0.99, 1.0 : 高多様化