論文読み会のための資料
(A slide for the paper-reading group at my company.)
Brownian Bridge Interpolationfor Human Mobility?著者: John Krumm, Microsoft Research読む人: @cocomoff@論文読み会 2021/12/14
View Slide
内容「Brownian bridge」っていう簡単な確率的補間手法があるけど,これって人間の位置情報の補間に使えるのか? を調べるために,12M人のデータに対して実際に適用してやってみた & 適用するために手法も確立したブラウン橋1/17
目次内容確率過程とブラウン橋論文のResearch Questionブラウン橋のパラメータを求める最尤推定法実験2/17
確率過程とブラウン橋 (1/3)確率過程: 時間などの条件によって変化する確率変数の数理モデル雑な理解: のようなオブジェクトを扱う道具マルコフ過程: が にのみ依存するガウス過程: から任意に 個取り出して (略) したものが常に多次元正規分布に従うような確率過程ブラウン運動: 微粒子がランダムに運動する物理現象ウィーナー過程: ブラウン運動の数学的なモデル標準ブラウン運動: 以下を満たす確率過程, は定常増分を持つ, は増分の列が互いに独立になる, ,確率1で は連続3/17マルコフ過程のうち,取りうる値が加算個以下の場合,マルコフ連鎖と呼ばれるアレになる
確率過程とブラウン橋 (2/3)ブラウン橋: 標準ブラウン運動の定義域 を にのみ制限し,であるような標準ブラウン運動実装的には, を標準ブラウン運動のオブジェクトとして,で定義されるような である4/17
確率過程とブラウン橋 (3/3)2次元のブラウン橋 (論文版): 2点 が観測済みで,その間をパラメータ で補間するような確率過程ただしパラメータは2点の線形補間平均ベクトル:分散はは唯一のパラメータ (diffusion coefficient と呼ばれる) 5/17
目次内容確率過程とブラウン橋論文のResearch Questionブラウン橋のパラメータを求める最尤推定法実験6/17
論文のResearch Questionブラウン橋の手法的な立ち位置ブラウン橋は人流データ補間に対してどういう性質を持つのかパラメータが でシンプルだけど,本当にOK?2つの角度から検証するdiffusion coefficient の consistency を確認する既存手法が遅いので,最尤推定法を作ったブラウン橋とデータの間で統計的検定をしてみる 7/17
目次内容確率過程とブラウン橋論文のResearch Questionブラウン橋のパラメータを求める最尤推定法実験8/17
点の取り方ブラウン橋は2点の補間なので,人流データから点を抽出して計算する論文で使ったデータ (左の範囲)論文では「50km以内」「48時間以内」の点を使ったパラメータ推定のために3点を抽出して推定する右図の取り方が Horne triples と呼ばれている (traditional method)本論文では全3点取る場合も考えて All triples と呼ぶ論文データではHornが286,541,325個,Allが173,844,732,847個9/17
最尤推定法データ位置 の尤度データに 個の3点があるので, として最尤推定する頑張って式展開すると以下が求まる ( )10/17
推定パラメータの使い方とデータ分割 | 個人単位データ (例えば人流) に対してどのように推定値 を使うのかHorne triplesとAll triplesを計算し,データ中の個人が持つtriplesの個数をカウントする (たぶん1つの を使っていいのか?を見たい)11/17
個人をグループ分けして複数のパラメータを推定する | 分割単位距離と時間の分かれぐらいでグループ分けして推定するのもアリ分解能を とし,データ全体をで分け,全体で を1000分割,を576分割し,全部で576,000個に分割して個数を可視化12/17
目次内容確率過程とブラウン橋論文のResearch Questionブラウン橋のパラメータを求める最尤推定法実験13/17
Diffusion Coefficientsの推定いろいろ推定した (individual vs collective, trimmed vs untrimmed)結論データでは人は単一の を持っていないHorne triplesとAll triplesでの差は大きくないが,傾向もない簡単に関連付けて結論付ける方法はなさそう14/17
統計的検定 | 平均ベクトルのHotelling's T-square testブラウン橋では間の点 について を期待帰無仮説: 期待ベクトルがゼロベクトルになるを変更した場合,どれぐらい検定が失敗するかのカーブを調べたHorn triplesを使うときはreasonableだが,all triplesでは…?15/17
統計的検定 | ガウス分布の検定2点の間を予測する確率が正規分布で書けることから,中間点が実際にガウス分布に従っているか?を検定で確認すれば良い (正規性の検定)と変数変換すると,である.今真の が分からないので, と設定した (正規性を怖さないからOK,というノリ)Henze-Zirkler testを利用した (最新のmultivariate nomality test)16/17
まとめやりたかったこと: 人流補間にブラウン橋が使えるのか?検討したことの検証: 最尤推定を提案した上で計算すると,人流の共通パラメータはなさそう.1つ選ぶならmedianとかを使うのが良さそうデータと比較した検定:(1) Horn triplesに対して,平均ベクトルはvalid(2) データはほとんどガウス分布に従っていないので,ブラウン橋はデータの補間として正確ではないそのためシンプルなブラウン橋でのタイトルへの答えは No今後の課題より複雑な過程,他の確率的な補間の検証,データからの学習17/17