Upgrade to Pro — share decks privately, control downloads, hide ads and more …

論文読み会 SIG-SPATIAL'21 | Brownian Bridge Interpolation for Human Mobility?

414e141aa769f7bf61977ee5fb15d1ba?s=47 cocomoff
December 14, 2021

論文読み会 SIG-SPATIAL'21 | Brownian Bridge Interpolation for Human Mobility?

論文読み会のための資料

(A slide for the paper-reading group at my company.)

414e141aa769f7bf61977ee5fb15d1ba?s=128

cocomoff

December 14, 2021
Tweet

More Decks by cocomoff

Other Decks in Research

Transcript

  1. Brownian Bridge Interpolation for Human Mobility? 著者: John Krumm, Microsoft

    Research 読む人: @cocomoff @論文読み会 2021/12/14
  2. 内容 「Brownian bridge」っていう簡単な確率的補間手法があるけど,これっ て人間の位置情報の補間に使えるのか? を調べるために,12M人のデータ に対して実際に適用してやってみた & 適用するために手法も確立した ブラウン橋 1/17

  3. 目次 内容 確率過程とブラウン橋 論文のResearch Question ブラウン橋のパラメータを求める最尤推定法 実験 2/17

  4. 確率過程とブラウン橋 (1/3) 確率過程: 時間などの条件によって変化する確率変数の数理モデル 雑な理解: のようなオブジェクトを扱う道具 マルコフ過程: が にのみ依存する ガウス過程:

    から任意に 個取り出して (略) したものが 常に多次元正規分布に従うような確率過程 ブラウン運動: 微粒子がランダムに運動する物理現象 ウィーナー過程: ブラウン運動の数学的なモデル 標準ブラウン運動: 以下を満たす確率過程 , は定常増分を持つ, は増分の列が互い に独立になる, ,確率1で は連続 3/17 マルコフ過程のうち,取りうる値が加算個以下の場合,マルコフ連鎖と呼ばれるアレになる
  5. 確率過程とブラウン橋 (2/3) ブラウン橋: 標準ブラウン運動の定義域 を にのみ制限し, であるような標準ブラウン運動 実装的には, を標準ブラウン運動のオブジェクトとして, で定義されるような

    である 4/17
  6. 確率過程とブラウン橋 (3/3) 2次元のブラウン橋 (論文版): 2点 が観測済みで,その間をパラメー タ で補間するような確率過程 ただしパラメータは2点の線形補間 平均ベクトル:

    分散は は唯一のパラメータ (diffusion coefficient と呼ばれる) 5/17
  7. 目次 内容 確率過程とブラウン橋 論文のResearch Question ブラウン橋のパラメータを求める最尤推定法 実験 6/17

  8. 論文のResearch Question ブラウン橋の手法的な立ち位置 ブラウン橋は人流データ補間に対してどういう性質を持つのか パラメータが でシンプルだけど,本当にOK? 2つの角度から検証する diffusion coefficient の

    consistency を確認する 既存手法が遅いので,最尤推定法を作った ブラウン橋とデータの間で統計的検定をしてみる 7/17
  9. 目次 内容 確率過程とブラウン橋 論文のResearch Question ブラウン橋のパラメータを求める最尤推定法 実験 8/17

  10. 点の取り方 ブラウン橋は2点の補間なので,人流データから点を抽出して計算する 論文で使ったデータ (左の範囲) 論文では「50km以内」「48時間以内」の点を使った パラメータ推定のために3点を抽出して推定する 右図の取り方が Horne triples と呼ばれている

    (traditional method) 本論文では全3点取る場合も考えて All triples と呼ぶ 論文データではHornが286,541,325個,Allが173,844,732,847個 9/17
  11. 最尤推定法 データ 位置 の尤度 データに 個の3点があるので, として最尤推定する 頑張って式展開すると以下が求まる ( )

    10/17
  12. 推定パラメータの使い方とデータ分割 | 個人単位 データ (例えば人流) に対してどのように推定値 を使うのか Horne triplesとAll triplesを計算し,データ中の個人が持つtriplesの個数

    をカウントする (たぶん1つの を使っていいのか?を見たい) 11/17
  13. 個人をグループ分けして複数のパラメータを推定する | 分割単位 距離と時間の分かれぐらいでグループ分けして推定するのもアリ 分解能を とし,データ全体を で分け,全体で を1000分割, を576分割し,全部で576,000個に分割して個数を可視化 12/17

  14. 目次 内容 確率過程とブラウン橋 論文のResearch Question ブラウン橋のパラメータを求める最尤推定法 実験 13/17

  15. Diffusion Coefficientsの推定 いろいろ推定した (individual vs collective, trimmed vs untrimmed) 結論

    データでは人は単一の を持っていない Horne triplesとAll triplesでの差は大きくないが,傾向もない 簡単に関連付けて結論付ける方法はなさそう 14/17
  16. 統計的検定 | 平均ベクトルのHotelling's T-square test ブラウン橋では間の点 について を期待 帰無仮説: 期待ベクトルがゼロベクトルになる

    を変更した場合,どれぐらい検定が失敗するかのカーブを調べた Horn triplesを使うときはreasonableだが,all triplesでは…? 15/17
  17. 統計的検定 | ガウス分布の検定 2点の間を予測する確率が正規分布で書けることから,中間点が実際にガ ウス分布に従っているか?を検定で確認すれば良い (正規性の検定) と変数変換すると, である.今真の が分からないので, と設

    定した (正規性を怖さないからOK,というノリ) Henze-Zirkler testを利用した (最新のmultivariate nomality test) 16/17
  18. まとめ やりたかったこと: 人流補間にブラウン橋が使えるのか? 検討したこと の検証: 最尤推定を提案した上で計算すると,人流の共通パラメ ータはなさそう.1つ選ぶならmedianとかを使うのが良さそう データと比較した検定: (1) Horn

    triplesに対して,平均ベクトルはvalid (2) データはほとんどガウス分布に従っていないので,ブラウ ン橋はデータの補間として正確ではない そのためシンプルなブラウン橋でのタイトルへの答えは No 今後の課題 より複雑な過程,他の確率的な補間の検証,データからの学習 17/17