Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【輪講資料】Time-aware Point-of-Interest Recommendati...

【輪講資料】Time-aware Point-of-Interest Recommendation【SIGIR2013】

2013-11-20に職場の輪講で発表した資料をアップロード.
SIGIR2013で発表された,Point of Interest(POI:店舗,ランドマーク,観光地など)の推薦手法の論文.時間帯ごとのチェックイン特徴の類似性を利用して,各時間帯にあわせたPOIを推薦するのが特徴です.

Yuichiro SEKIGUCHI

November 20, 2013
Tweet

More Decks by Yuichiro SEKIGUCHI

Other Decks in Research

Transcript

  1. 2013-11-20 1 2013-11-20 1 Time-aware Point-of-Interest Recommendation Quan Yuan, Gao

    Cong, Zongyang Ma, Aixin Sun, Nadia Magnenat-Thalmann Nany Nanyang Technological University, Singapore 2013-11-20 輪講資料
  2. 2013-11-20 2 2013-11-20 2 まとめ  目的:ユーザへのPoint-of-Interest(POI)の推薦  特徴:チェックインの時間特徴とPOI間の距離特徴を 推薦に利用

     POI推薦に時間特徴を取り入れた初の取組み(著者曰く)  1日を1時間ごとの24枠に分ける  スパース性に対応するためのスムージング手法を提案  評価:Foursquare, Gowallaのデータを用いて実験  時間と距離を利用することによる精度向上を確認  時間帯ごとに精度向上度合いに差がある
  3. 2013-11-20 3 2013-11-20 3 はじめに  Location-based social networks(LBSN)が成長中 

    foursquare, facebook places, ...  Foursquareは3000万ユーザ,30億チェックイン,5000万POI » POI = Point-of-Interest = 店舗,観光地などのスポット » チェックイン = ある地点にきたよ,という情報 POIの例 チェックインの例
  4. 2013-11-20 4 2013-11-20 4 対象タスク:ユーザへのPOIの推薦  過去のチェックイン情報用いてPOIを推薦する 田町でいつもチェックインしている ⇒ラーメン二郎を推薦 

    POIの推薦はユーザ側,店舗側双方にメリットがある ユーザ:次に行く所が簡単に見つかる 店舗:来客増⇒収入増  送客により店舗から報酬を得るビジネスモデルを想定?
  5. 2013-11-20 5 2013-11-20 5 本研究の特徴  既存研究からの知見  POIの地理的情報は推薦に大きく影響する 

    友人関係の情報は推薦精度に影響しない  協調フィルタ(CF)を使うならユーザベースが良い » アイテムベースやランダムウォークベースは良くない  時間帯ごとにユーザの行動様式は変化する  地理情報と時間情報を用いたユーザベースCF  1日を1時間ごとの24枠に分ける  各スロットごとにユーザベースCFを実施する
  6. 2013-11-20 6 提案手法 1-1. ユーザベース協調フィルタ(U) 2-1. 時間枠を考慮したCF(UT) 2-2. スムージングを行ったCF(UTE) 3-1.

    距離を考慮した手法(S) 3-2. 距離手法の時間枠拡張(SE) 4-1. 時間・距離統合手法(UTE+SE) 2013-11-20 6
  7. 2013-11-20 8 2013-11-20 8 1-1. ユーザベースCF(U)  ユーザuに対するPOI l の推薦度cu,l

    を計算する cu,l : uがlにチェックインしたことがあるかどうか(1or0) wu,ν : 他のユーザνとの類似度(コサイン類似度で算出)
  8.  1時間ごとに24枠に分ける  ベクトルの要素が24倍になったとみなして計算 2013-11-20 9 2013-11-20 9 2-1. ユーザベースCFへの時間枠導入(UT)

    …… t=AM1時 t=AM2時 t=AM3時 3 ? 1 4 4 2 1 3 3 1 2 5 1 4 4 2 2 3 5 1 3 ? 1 4 4 2 1 3 3 1 2 5 1 4 4 2 2 3 5 1 3 ? 1 4 4 2 1 3 3 1 2 5 1 4 4 2 2 3 5 1
  9. 2013-11-20 10 2013-11-20 10 課題:スパース性への対処  時間枠ごとのチェックイン数が極めて少ない  時間を考えない場合の約13分の1 

    同じ時間枠に同じPOIにチェックインしていないと が0になってしまう ⇒類似度が0になる  スムージングしよう!  でも離れた時間枠でも似た所があるので難しい » 出社時間&退社時間とか » 昼休みの情報を13時以降に足し合わせても 一部の時間枠のみで チェックイン 周辺の時間枠にも 値が入る
  10. 2013-11-20 13 距離によるチェックイン確率  次にチェックインする 確率は距離で低下  で近似する  10km以上を削除し,

    最小二乗法を適用  liの次にljにチェックインする確率を以下で正規化 2013-11-20 13
  11. 2013-11-20 17 データセット  Foursquare@Singapole の1年分  Gowalla@California&Nevada の1年分 

    チェックイン5件以下のユーザ,POIを事前に削除  POIの12.5%を調整用データ, 25.0%を評価用(正解)データ, 残りを学習用データとする. ⇒以後,傾向同じなのでFoursquareのみ説明
  12. 2013-11-20 18 評価手法①  Precision@N, Recall@Nで評価  推薦件数が5件ならば,Precision@5  N=3の場合の計算例

     ユーザに推薦した3件が[a,c,f]  正解データに含まれるユーザがチェックインしたPOIが [a,b,c,d,e]  推薦3件中a,cが正解に含まれる⇒Precision@3=2/3  正解5件中a,cが正解に含まれる⇒Recall@3=2/5
  13. 2013-11-20 20 提案手法+ベースライン 1-1. ユーザベース協調フィルタ(U) 1-2. 既存時間考慮協調フィルタ(UTF) 2-1. 時間枠を考慮したCF(UT) 2-2.

    スムージングを行ったCF(UTE) 3-0. 既存距離手法(SB) 3-1. 距離を考慮した手法(S) 3-2. 距離手法の時間枠拡張(SE) 4-0. 協調フィルタ+既存距離手法(U+SB) 4-1. 時間・距離統合手法(UTE+SE) 2013-11-20 20
  14. 2013-11-20 25 2013-11-20 25 まとめ  目的:ユーザへのPoint-of-Interest(POI)の推薦  特徴:時間特徴と距離特徴を推薦に利用 

    POI推薦に時間特徴を取り入れた初の取組み(著者曰く)  1日を1時間ごとの24枠に分ける  スパース性に対応するためのスムージング手法を提案  評価:Foursquare, Gowallaのデータを用いて実験  時間と距離を利用することによる精度向上を確認  時間帯ごとに精度向上度合いに差がある  今後の課題  曜日とか月とかの時間枠の考慮  POIのカテゴリ情報の考慮  時間特徴と距離特徴の融合方法の検討