論文読み会 SIGIR2018 | Top-k Route Search through Submodularity Modeling of Recurrent POI Features

@cocomoff 論⽂読み会 2020/8/6( ⽊)

概要旅⾏のルート推薦 (POI めぐり) のために，個ぐらい経路を返したいユーザの好みみたいなものを考慮する (personalized) 必要に応じて経路のdiversity も考慮する
1/14 k

論⽂の貢献 personalized & diversity を考慮するTop- 経路探索を定式化前処理 (indexing) と枝刈りを使った厳密解法PACER の提案
2 つのヒューリスティクスを提案 (good efficient-accuracy trade-off) 実データを⽤いてベースライン⼿法より⾼速なことを確認 2/14 k

問題設定 (1/2) グラフのノードがPOI で，属性ベクトルが付与されている ( 次元ぐらい．図1
では ) 3/14 G = (V , E) n ∈ V Fn ∣H∣ H = {Park, Museum, Restaurant}

問題設定 (2/2) 推薦する経路のコストは滞在時間+ 移動時間 cost(P) := s + i∈PV
∑ i T i→j∈P ∑ i,j ユーザはから出発してへ向かい，特徴の好みベクトル，予算，閾値，集約関数をもつ (query ) 集約関数は，経路のどこを評価するか？を抽象的に書いたもの下の定義だとイマイチよく分からない ( 論⽂通じてよく分からない) このとき，経路を通る場合の利得は Gain(P , Q) : V = w Φ (P ) h∈H ∑ h h V 4/14 P x y w ∈ [0, 1]∣H∣ b θ Φ Q = (x, y, b, w, θ, Φ) Φ PV Gain

からへのユーザが⾏く ( 経路上の輪) ( 経路上の最⼤) によってルートの上で得られる値の集約⽅法が変化問題: 通過するPOI
集合が異なる利得が⼤きい個の経路を発⾒したい v1 v5 w = (0.4, 0.6, 0), b = 18 v → 1 v → 6 v → 4 v ，Φ : 5 = sum v → 1 v → 2 v → 3 v , Φ : 5 = max Φ k

劣モジュラ関数を⽤いたdiversity requirement (1/2) 集合について，を集合関数と呼ぶ任意のについて [ 限界効⽤逓減]
が成り⽴つ場合，劣モジュラ関数と呼ぶについてのとき，は単調と呼ぶについてのとき，は⾮負と呼ぶ定理1 各属性についてが単調⾮負な劣モジュラ関数であるとき，も単調⾮負な劣モジュラ関数 ∵⾮負係数を使った線形結合なため 5/14 V f : 2 → V R X ⊆ Y ⊆ V , v ∈ V ∖ Y f(X ∪{v}) − f(x) ≥ f(Y ∪{v}) − f(Y ) X ⊆ Y ⊆ V f(X) ≤ f(Y ) f X ⊆ V f(X) ≥ 0 f h ∈ H Φh Gain(P , Q) V

劣モジュラ関数を⽤いたdiversity requirement (2/2) 論⽂で扱う形式 ( あまり気持ちはよく分からない) は経路の中で，番⽬に訪問する地点のランク例:
はランク2 ，はランク1 のとき， Φ (P ) : h V = R (i) i∈PV ∑ h −α(h)F ~ i,h : diminishing 度合い ( だとsum ，だとmax) 定理2: 上の式は⾮負，単調な劣モジュラ関数劣モジュラの話は実際，あんまり使わないけど… 6/14 R (i) h PV i A(3) → B(5) A B α = 1 2 × −1 3 + 1 × −1 5 α α = 0 α → ∞

Indexing 経路探索を⾏うときに，だけから分かる情報とから分かる情報を持つ 7/14 G Q

Optimal Route Search クエリより，となるPOI を取り除く ( ) PACER:
Prefix bAased Compact statEs gRowth 残っているPOI から，現在構築中の経路を拡張 + 枝刈り基本的な考え⽅ (route search space) 経路に付随する値訪問POI ， , 最後のPOI ，コスト開始地点から始めるある経路 (open route) が⽬的地で終わるとき close route と呼ぶあるopen route ( ) にまだ訪れていないを追加するに付随する値に，の増分を追加する 8/14 Q s + x T + x,i s + i T + i,y s > y b i VQ VQ P P PV Gain(P ) V end(P) cost(P) x P y P− end(P) = i j P− i

例えば POI の集合ぐらいの粒度で状態空間をまとめて良い (compact state) cost(P) = cost(P )
+ − T + i,j sj C

枝刈り詳細 ( 約1.5 ページぐらい，概要のみ) いくつかのテクニック ( 単調性，代表元を選ぶ，劣モ最⼤) Compact State 経路
のコストにはPOI の順序が関係するけど，利得は関係なし列挙⽊の状態 ( ノード) を集合で管理しつつ，順序は別で覚える Cost-dominance pruning (Pruning-1) 仮に経路についてであり，を拡張した新しい経路と同じ拡張がにも適⽤できてコストが⼩さくなる Gain-based pruning (marginal gain upper-bound pruning, Pruning-2) 経路からへ拡張することを考える ( 残り予算は ) 利得の増分が⾮負単調な劣モジュラ関数 Gain 増分を最⼤化するために，厳密 or greedy alg. を適⽤できる 9/14 C P P, P′ cost(P) ≤ cost(P ) ′ P′ P′ ^ P PV P ^ V Δb ΔGain( ∣ P ^ V P ) V

ヒューリスティクス State collapse heuristic 列挙⽊の中にはたくさんのルートが格納されている (cost- dominance 性を使いながらうまく) SC (state-collapse):
多くのPOI を訪問する経路を1 つだけ残す Greedy algorithm 最初の経路に，以下の数値順でPOI を追加する利得が⼤きそう，かつ滞在時間とスタート，ゴールからの移動コストが少なそうなところが順序が上 s + T + T i x,i i,y Gain({i} ∪C) − Gain(C) 10/14 x → y x y

実験設定以前の研究でも使われていたデータセットらしいデータから，例えばPOI のチェックイン数などが分かるこれらを使って特徴ベクトルを作るユーザの好みはデータ中のユーザに着⽬し，ユーザのチェックインした履歴を真似てベクトルを作る
クエリー : パラメータはランダムに作り，をくっつける 11/14 i NC(i) Fi w Q b, θ, α w

実験 (1) 評価指標: を代えたときの計算時間/ 経路数/ 利得 BF は総当り，PACER はPruning をくっつけたもの，GR
は貪欲，AP は既存 (?) の近似アルゴリズム，A* はそのまま ( 次ページ) BF は総当りなので， (50 例のうちクエリーは計算できなかった) 12/14 b, θ, α n/m n

実験 (2) ( 前ページ) は予算≒ 経路⻑さなので，とても増えるは余計なものが減る感じ，はよく分からない 12/14 b
θ α

実験 (3) の効果 (= route diversity に寄与) の⽐較左は，右は
13/14 α α = 0.5 α = 0.0

実験 (4) A* とPACER-2 (PACER+Pruning-1+Pruning-2) の⽐較 ( どちらもExact) 13/14

論文読み会 SIGIR2018 | Top-k Route Search through Su...

論文読み会 SIGIR2018 | Top-k Route Search through Submodularity Modeling of Recurrent POI Features

cocomoff

More Decks by cocomoff

Other Decks in Research

Featured

Transcript

@cocomoff 論⽂読み会 2020/8/6( ⽊)

概要旅⾏のルート推薦 (POI めぐり) のために，個ぐらい経路を返したいユーザの好みみたいなものを考慮する (personalized) 必要に応じて経路のdiversity も考慮する

論⽂の貢献 personalized & diversity を考慮するTop- 経路探索を定式化前処理 (indexing) と枝刈りを使った厳密解法PACER の提案

問題設定 (1/2) グラフのノードがPOI で，属性ベクトルが付与されている ( 次元ぐらい．図1

問題設定 (2/2) 推薦する経路のコストは滞在時間+ 移動時間 cost(P) := s + i∈PV

からへのユーザが⾏く ( 経路上の輪) ( 経路上の最⼤) によってルートの上で得られる値の集約⽅法が変化問題: 通過するPOI

劣モジュラ関数を⽤いたdiversity requirement (1/2) 集合について，を集合関数と呼ぶ任意のについて [ 限界効⽤逓減]

劣モジュラ関数を⽤いたdiversity requirement (2/2) 論⽂で扱う形式 ( あまり気持ちはよく分からない) は経路の中で，番⽬に訪問する地点のランク例:

Indexing 経路探索を⾏うときに，だけから分かる情報とから分かる情報を持つ 7/14 G Q

Optimal Route Search クエリより，となるPOI を取り除く ( ) PACER:

例えば POI の集合ぐらいの粒度で状態空間をまとめて良い (compact state) cost(P) = cost(P )

枝刈り詳細 ( 約1.5 ページぐらい，概要のみ) いくつかのテクニック ( 単調性，代表元を選ぶ，劣モ最⼤) Compact State 経路

ヒューリスティクス State collapse heuristic 列挙⽊の中にはたくさんのルートが格納されている (cost- dominance 性を使いながらうまく) SC (state-collapse):

実験 (1) 評価指標: を代えたときの計算時間/ 経路数/ 利得 BF は総当り，PACER はPruning をくっつけたもの，GR

実験 (2) ( 前ページ) は予算≒ 経路⻑さなので，とても増えるは余計なものが減る感じ，はよく分からない 12/14 b

実験 (3) の効果 (= route diversity に寄与) の⽐較左は，右は

実験 (4) A* とPACER-2 (PACER+Pruning-1+Pruning-2) の⽐較 ( どちらもExact) 13/14