Upgrade to Pro — share decks privately, control downloads, hide ads and more …

推薦システムとは | 第1回 推薦システム概論

推薦システムとは | 第1回 推薦システム概論

下記教科書を基にした推薦システム概論の講義スライドです。
奥 健太:基礎から学ぶ推薦システム - 情報技術で嗜好を予測する -, コロナ社 (2022)

当スライドの利用については下記サポートサイトをご参照ください。
推薦システム概論 | recsys-text

okukenta

May 08, 2022
Tweet

More Decks by okukenta

Other Decks in Technology

Transcript

  1. 推薦システムとは Amazon [1] • 「この商品を買った人はこんな商品も買っています」 • 購入履歴や閲覧履歴に基づく「おすすめ商品」 Netflix [2] •

    人気の映画や自身の興味に合った映画が推薦される Spotify [3] • 人気アーティストによるプレイリストや気分に合ったプレイリストなどが推 薦される [1] https://www.amazon.co.jp/(2022年6月現在) [2] https://www.netflix.com/(2022年6月現在) [3] https://www.spotify.com/(2022年6月現在)
  2. 膨大なコンテンツ 世界の本の数 [4]: ※2010年8月現在 Apple Musicでの配信楽曲数 [5]: ※2022年6月現在 9,000万曲以上 129,864,880冊

    Spotifyでの配信楽曲数 [6]: ※2022年6月現在 7,000万曲以上 IMDbでの登録映画タイトル数 [7]: ※2022年3月現在 60万件以上 [4] http://booksearch.blogspot.com/2010/08/books-of-world-stand-up-and-be-counted.html(2022年6月現在) [5] https://www.apple.com/jp/apple-music/(2022年6月現在) [6] https://www.businessofapps.com/data/spotify-statistics/#4(2022年6月現在) [7] https://www.imdb.com/pressroom/stats/(2022年6月現在)
  3. 膨大なユーザ生成コンテンツ YouTube [8][9]: ※2022年6月現在 毎分 500 時間以上もの動画投稿 Twitter [10]: ※2018年5月現在

    毎分 456,000 ツイート Instagram [10]: ※2018年5月現在 毎分 46,740 写真 Facebook [10]: ※2018年5月現在 毎秒 5 プロフィール [8] https://www.tubefilter.com/2019/05/07/number-hours-video-uploaded-to-youtube-per-minute/(2022年6月現在) [9] https://www.youtube.com/intl/ALL_jp/howyoutubeworks/product-features/search/(2022年6月現在) [10] https://www.forbes.com/sites/bernardmarr/2018/05/21/how-much-data-do-we-create-every-day-the-mind-blowing-stats-everyone-should-read/(2022年6月現在)
  4. ユーザ(user) 推薦システムの利用者 ➢ 推薦を受けようとしているユーザを対象ユーザ(active user)とよぶ ユーザ集合 ユーザ ユーザ数 ユーザに関するデータ ユーザID

    ユーザ名 年齢 性別 1 Alice 20 女 2 Bruno 22 男 3 Chiara 21 女 4 Dhruv 21 男 5 Emi 20 女 デモグラフィック属性(demographic attribute)
  5. ➢ 評価値の予測対象となるアイテムを対象アイテム(target item)とよぶ アイテム(item) 推薦システムにおいて扱う商品やコンテンツ 推薦システムが保有するアイテムデータベース アイテム アイテム集合 アイテム数 アイテムID

    アイテム名 トッピング いちご ラズベリー バナナ チョコ ホイップ カスタード 1 いちごクレープ 1 0 0 0 1 0 2 ラズベリークレープ 0 1 0 0 1 0 : : : : : : : : 13 ラズベリーチョコバナナクレープ 0 1 1 1 1 0
  6. アイテムの属性と特徴量 属性(attribute) アイテム i の属性 k に 対する特徴量(feature) アイテムID アイテム名

    トッピング いちご ラズベリー バナナ チョコ ホイップ カスタード 1 いちごクレープ 1 0 0 0 1 0 2 ラズベリークレープ 0 1 0 0 1 0 : : : : : : : : 13 ラズベリーチョコバナナクレープ 0 1 1 1 1 0
  7. 特徴ベクトル(feature vector) アイテム i の特徴ベクトル(feature vector) アイテムID アイテム名 トッピング いちご

    ラズベリー バナナ チョコ ホイップ カスタード 1 いちごクレープ 1 0 0 0 1 0 2 ラズベリークレープ 0 1 0 0 1 0 : : : : : : : : 13 ラズベリーチョコバナナクレープ 0 1 1 1 1 0
  8. ユーザ u のアイテム i に対する 評価値(rating) 評価履歴(rating history) ユーザ アイテム

    評価値 1: Alice 2: マグロ 4 1: Alice 3: 中トロ 3 1: Alice 4: タイ 1 1: Alice 5: ヒラメ 2 2: Bruno 1: カツオ 5 : : : 5: Emi 6: スズキ 3 ユーザがこれまでに利用してきたアイテムに対する評価値の履歴 評価履歴
  9. 評価履歴から評価値行列へ ユーザ アイテム 評価値 1: Alice 2: マグロ 4 1:

    Alice 3: 中トロ 3 1: Alice 4: タイ 1 1: Alice 5: ヒラメ 2 2: Bruno 1: カツオ 5 : : : 5: Emi 6: スズキ 3 評価履歴 評価値行列 ユーザ u アイテム i
  10. 対象ユーザ u の対象アイテム i への予測評価値(predicted rating) (1) 嗜好予測問題(preference prediction problem)

    与えられたユーザ集合 U およびアイテム集合 I において、対象ユーザ u によって 未評価である対象アイテム i への評価値 ru,i を予測する問題 推薦問題(recommendation problem) (2) 上位 K 推薦問題(top-K recommendation problem) 上位 K 件の推薦リストを生成する問題