Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
論文読み会 HT2010 | Automatic Construction of Travel Itineraries Using Social Breadcrumbs
cocomoff
March 14, 2022
Research
0
13
論文読み会 HT2010 | Automatic Construction of Travel Itineraries Using Social Breadcrumbs
論文読み会・紹介のための資料.
(A slide for the paper-reading group at my company.)
cocomoff
March 14, 2022
Tweet
Share
More Decks by cocomoff
See All by cocomoff
論文読み会 EMNLP2021 | Decision-Focused Summarization
cocomoff
0
39
論文読み会 AAAI2022 | Online Certification of Preference-based Fairness for Personalized Recommender Systems
cocomoff
0
250
論文読み会 SIG-SPATIAL'21 | Brownian Bridge Interpolation for Human Mobility?
cocomoff
0
18
論文読み会 SIG-SPATIAL'20 | Spatio-Temporal Hierarchical Adaptive Dispatching for Ridesharing Systems
cocomoff
0
10
論文読み会 SDM2021 | LDFeRR: A Fuel-efficient Route Recommendation Approach for Long-distance Driving Based on Historical Trajectories
cocomoff
0
8
論文読み会 SIG-SPATIAL'20 | (k,l)-Medians Clustering of Trajectories Using Continuous Dynamic Time Warping
cocomoff
0
89
論文読み会 ICLR2021 | Learning a Latent Search Space for Routing Problems using Variational Autoencoders
cocomoff
0
130
論文読み会 SDM2020 Content-Aware Successive Point-of-Interest Recommendation
cocomoff
0
26
論文読み会LT KDD2020&ECAI2020
cocomoff
0
140
Other Decks in Research
See All in Research
2022年住宅用蓄電池購入者・購入検討者の実態調査・意識調査 - 経済効果シミュレーションの影響度-
satoru_higuchi
0
300
AI最新論文読み会2022年8月
ailaboocu
0
150
PLDI '21論文読み会: Specification Synthesis with Constrainted Horn Clauses
ideininc
0
810
局所特徴量:画像認識における特徴表現獲得の変遷
hf149
7
2.4k
DoubleField_CV勉強会_CVPR2022.pdf
kanosawa
0
140
Crescent Street Bike Lane Presentation
wolframalexa
0
140
「Lean Interview」 誰でも、ほぼコストゼロ、1日でできるインタビュー法
shintokeimail
0
160
See-Through Captions in a Museum Guided Tour: Exploring Museum Guided Tour for Deaf and Hard-of-Hearing People with Real-Time Captioning on Transparent Display ICCHP-AAATE 2022 #ICCHP_AAATE_22 (Oral presentation by Ippei Suzuki)
digitalnaturegroup
0
850
ICSE22: An Exploratory Study of Deep Learning Supply Chain
sunflowerpku
0
310
BigQueryとPythonではじめるプロ野球選手の成績予測(もしくは成績占い) / Baseball Player Performance Prediction using BigQuery and Python
shinyorke
0
670
第13回チャンピオンズミーティング・タウラス杯ラウンド1集計 / Umamusume Taurus 2022 Round1
kitachan_black
0
770
企業の女性活躍推進 分析レポート2022年版 -Forbes JAPAN WOMEN AWARD
libinc
1
170
Featured
See All Featured
Ruby is Unlike a Banana
tanoku
91
9.3k
Product Roadmaps are Hard
iamctodd
35
6.8k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
15
970
Put a Button on it: Removing Barriers to Going Fast.
kastner
56
2.3k
Producing Creativity
orderedlist
PRO
334
37k
The Invisible Side of Design
smashingmag
290
48k
Why Our Code Smells
bkeepers
PRO
324
55k
Done Done
chrislema
174
14k
Large-scale JavaScript Application Architecture
addyosmani
499
110k
Designing on Purpose - Digital PM Summit 2013
jponch
106
5.7k
Fireside Chat
paigeccino
13
1.4k
Keith and Marios Guide to Fast Websites
keithpitt
404
21k
Transcript
Automatic Construction of Travel Itineraries Using Social Breadcrumbs 著者: Choudhury,
M. et al. (Yahoo! Research多め=Flickrデータ) 学会: HT2010 (and WWW2010) (HT: ACM conference on Hypertext and hypermedia) 読む人: @cocomoff
概要 Flickrデータ (日時・場所・POIとの関連性・メタタグ) を収集した上で, 時間パスを作成し,時間パスから旅程を作成する手法を提案した. 各都市 で,作成した4つの旅程と1つのground-truth旅程を用意し, AMTアンケート調査を行った結果,ground-truth旅程に対する反応 (like/dislike) と似た結果が得られた
= 高品質旅程を自動生成できた : バルセロナ,ロンドン,ニューヨーク,パリ,サンフランシスコ (ground-truthはツアリスト向けサイトから取得)
単体アンケート評価
結果 Q1-Q4の比較 (ロンドン) MWR (Mean Weighted Response 定義は後ほど) Q1-Q4の5都市比較
目次 概要 手法 時間パス (Timed path) の生成 §3 旅程の生成 §4
実験 §5 結論 §6
時間パスの生成 (1/5) | 目的と課題 目的 (書いてないけど推測) 旅程を作るためにオリエンテーリング問題 (後で) を解くので,それに必 要な情報を集合から取り出してくるために時間パスを作成する
課題 1. 旅行者に関係のない写真・POIに関係のない写真を取り除く 2. 写真とPOIを対応付ける 3. 時間パスを作る
時間パスの生成 (2/5) | 記号 記号 写真の集合 ,所有者の集合 ,都市の集合 , のPOIの集合
写真 の属性: 所有者 ,撮った人/アップロードした人 ,撮った位置 ,タグ メモ: Flickrにはphoto-setという概念がある (アルバム?).photo- setについたタグは写真についたタグと思ってpropagateしている. POIのソースはYahoo! Travel/Lonely Planet POIの情報は名前 ,都市 ,位置
時間パスの生成 (3/5) | ユーザのPhoto Stream作成 タスク1: 対象の都市で取られた写真のみを探す 写真 が都市 に関連づいている
写真 のタグに,都市 の名前 のvariantを1つでも含む (例: New York City, NYC, Manhattan) タスク2: 旅行者らしいユーザを探す (= 住民じゃないユーザ) ユーザ が都市 の旅行者である 都市 における最初の写真撮影 時間と最後の時間が 日以下 (実験では ). タスク3: 旅程に使いたいので時刻情報が怪しい写真を取り除く 写真 の は正確である 「分」と「秒」の情報について, .または一致していても と で24時間以上離れている. タスク1~3を終えると,ユーザごとのストリーム が得られる
時間パスの生成 (4/5) | 写真とPOIの対応付け 都市 におけるユーザごとの写真ストリーム から抽出する 都市 に関連づいたPOIは情報源から取得する (集合
) 定義: 写真と都市の関連付け 2種類 (geo-based, tag-based) の方法で判定する geo-based: 位置情報 (lat/long) を使って100m以内ならYes (ただし写真 の最近傍のPOI にのみ判定する) tag-based: geo情報が欠けているときに使う.タグとPOIの名前 を単純にマッチングする (手法: tri-gram, しきい値0.3). (おなじく最も類似度が高いPOI にのみ判定する) 作成したストリーム が得られる
時間パスの生成 (5/5) | 時間パスの生成 ユーザのストリームが最大で 日つながっている可能性があるの で,撮影感覚が 時間超えているところで切る (その後1つのPOIし か訪問しないデータや,
写真未満しか含まないものを捨てる) 各セグメントのうち旅行者じゃないものを消し,時間パスとして保存 処理 POIの訪問情報 : で最初と最後に撮った写真から取得 セグメントの中の訪問情報の列を時間パスと呼ぶ (ただし ) 差分 はtransit timeと呼ばれる (当たり前) 出力としてPOI間の移動時間情報 (過去に実績のある) が得られた
目次 概要 手法 時間パス (Timed path) の生成 §3 旅程の生成 §4
実験 §5 結論 §6
旅程の作成 (1/3) | データのグラフ化 過去の個別の旅行者が残した時間パスの集合から旅程を作成したい 定義: 完全グラフ .頂点と辺に次のよう な重み と,頂点に別の重み
を持っている. : POIの訪問時間 (ユーザごとの最大訪問時間を取り,全デー タの75th percentileを利用した) : POI間の移動時間 (データ中のmedianを使った) ただしデータから取得すると三角不等式を満たさなくなるの で,metric completionという手法を使って直した : POIの価値 (訪問した人数を使った)
旅程の作成 (2/3) | 最適化問題の定義 次のような最適化問題 (NP-hard) を定式化した IMP (Itinerary Mining
Problem) 入力: グラフ ( と一緒に),出発地と目的地 ,コスト (最大移動時間) 出力: 移動時間が 以下で訪問地点の価値の和が最大になる順 オリエンテーリング問題と呼ばれるやつの仲間.似た問題設定の近似比は ( は営業時間窓の最大と最小).典型的 なアルゴリズムの動作は 以上.他にもたくさんある. ただし旅程計画問題は頂点にもコスト (滞在時間) が乗っているので,オ リエンテーリング問題のアルゴリズムをそのまま使えない.
旅程の作成 (3/3) | 近似手法RG-QP 頂点のコストを辺のコストに変換 する前処理を行う RG-QP: 旅程で訪問できる個数を半 分ずつにしながら探索するような イメージの再帰的貪欲法
オリエンテーリング問題の手 法を拡張 複数日 (multi-day itineraries) RG-QPを複数回使えばOK.た だし貪欲法的につなげただけなので良いかどうかは別… その他細かい処理は一部省略とのこと
目次 概要 手法 時間パス (Timed path) の生成 §3 旅程の生成 §4
実験 §5 結論 §6
実験 (1/α) | データ POIの個数がオリエンテーリング問題の頂点数 (最大163POI).辺と頂点の 重みは約4000~19000の時間パスから計算された. 4つの旅程の作り方: POIの有名なもの4つ (
) を取ってきて, を として作成 ( h).
実験 (2/α) | NYCの旅程例 よく分からんけど…
実験 (3/α) | 図 (google map 途中まで)
実験 (4/α) | 実験設定 AMT 概念とタスク・使い方の説明 (2010年の論文なので) やりたいこと: reliable workers
を探す (= 旅程タスクに知見が必要); finding users who are deeply familiar with foreign cities. approval rateの説明 初期問題の説明; 3枚の写真 (都市でマイナーなPOIの) と名前の候補 が表示され,それにすべて答えられるexpert workersを探す 評価 §5.3 side-by-side comparison = 横並べの対照比較? workerに作成した旅程とground-truth旅程を提示して比較 §5.4 旅程単体の評価
実験 (5/α) | 比較評価の方法 5都市について,それぞれ4つの旅程を作成し,1つの旅程を10 identical HITsにして,各都市のground-truth旅程と比較 (4×10×5=200回) 2つ (A,
B) 提示し「どちらが良いか?」を聞く; Q1: AがBと比較して…: significantly better, somewhat better, similar, somewhat worse, significantly worse Q2: 表示されているPOIのappropriateness (たぶん↑の5段階) 評価指標 : においてワーカが問 に を投票した回数 : 問 に を投票した総数
実験 (6/α) | 比較評価の結果 (旅程 Q1) 66%が生成された旅程が良いと答えた (14%はNo) (POIs Q2)
52%が生成された旅程のPOIが良いと答えた (16%はNo)
実験 (7/α) | 個別評価 冒頭に述べた ~ を用いて単体の評価を行った 評価指標 : 問
に 番目の返答をしたワーカの数 アンケートの平均数値 : 旅程 に回答したワーカの集合 : ワーカによって「bad」と報告されたPOIの個数 bad w.r.t. POIs, Visit Times, Transit Times (3つ) 旅程の中身の質評価
実験 (8/α) | 個別評価の結果 (再掲) Q1-Q4の比較 (ロンドン) MWR = ほぼ同じ
(冒頭) Q1-Q4の5都市比較 (冒頭,省略) MEFによる質評価 両方大きな差はないが,10%-15%ぐらいは微妙なやつが入る
目次 概要 手法 時間パス (Timed path) の生成 §3 旅程の生成 §4
実験 §5 結論 §6
結論 旅程推薦の分野で2022年から見てかなり初期の論文 (約300引用) ユーザごとの時間パスを作成し,オリエンテーリング問題の亜種を用いて 旅程を生成するような枠組みを提案し,Flickrデータで実証した 実験よりproの作成したGTと比較してcomparable(?) いくつかのポイント 固定のハイパーパラメータがあるので弄ると良いかも 平均的な旅程を出す (general
itineraries, not personalized) 共通して訪問するパターン (Co-visitation patterns) の扱いにもう少 し工夫がいりそう データが少ない都市や12時間未満の扱いなどスパースデータの対応