Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
位置情報ビッグデータ分析の舞台裏
Search
NAVITIME JAPAN
PRO
October 04, 2017
Research
0
18
位置情報ビッグデータ分析の舞台裏
Minami Aoyama Night#4での発表資料です。
NAVITIME JAPAN
PRO
October 04, 2017
Tweet
Share
More Decks by NAVITIME JAPAN
See All by NAVITIME JAPAN
見えないユーザの声はログに埋もれている! ~ログから具体的なユーザの体験を数値化した事例紹介~
navitimejapan
PRO
6
1.7k
ユーザーのためなら 『デザイン』 以外にも手を伸ばせる
navitimejapan
PRO
2
1k
フツーのIT女子が、 Engineering Managerになるまで
navitimejapan
PRO
3
130
不確実性に打ち勝つOKR戦略/How to manage uncertainty with OKR strategy
navitimejapan
PRO
4
3k
アジャイルを小さいままで 組織に広める 二周目 / Agile Transformation in NAVITIME JAPAN iteration 2
navitimejapan
PRO
4
1.2k
変更障害率0%よりも「継続的な学習と実験」を価値とする 〜障害を「起こってはならないもの」としていた組織がDirtの実施に至るまで〜 / DevOps Transformation in NAVITIME JAPAN
navitimejapan
PRO
7
4.8k
こうしてふりかえりは終わってしまった / A Demise of a retrospective
navitimejapan
PRO
44
27k
もーひとつの時間がない症候群 / Yet Another SOT Syndrome
navitimejapan
PRO
1
2.1k
シーズン2〜スクラムチームのバトンを渡す〜 / Season 2 -pass the button of a scrum team-
navitimejapan
PRO
2
2.9k
Other Decks in Research
See All in Research
初めての研究発表を成功させよう! スライド作成の基本
ayaco0
10
4.1k
20240523 Japan Investment Conference 2024
cfajapan
0
730
スモールデータ勉強会発表資料
natsutan
0
310
Engineering LaCAM∗: Towards Real-Time, Large-Scale, and Near-Optimal Multi-Agent Pathfinding
kei18
0
460
Introduction of NII S. Koyama's Lab (AY2024)
skoyamalab
0
330
「人間にAIはどのように辿り着けばよいのか?ー 系統的汎化からの第一歩 ー」@第22回 Language and Robotics研究会
maguro27
0
410
LLMとの共同執筆は文章の多様性を減らすか?
kuri8ive
3
690
CARA MEMBUKA VIDEO DEWASA DI INDONESIA
bloglangit
0
320
医療分野におけるLLMの現状と応用可能性について
kento1109
5
550
20240710_熊本県議会・熊本市議会_都市交通勉強会
trafficbrain
0
560
SSII2024 [TS2] 深層学習に潜むバイアス
ssii
PRO
0
520
SSII2024 [OS2] 大規模言語モデルとVision & Languageのこれから
ssii
PRO
5
1.3k
Featured
See All Featured
What's in a price? How to price your products and services
michaelherold
239
11k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
23
1.9k
Rails Girls Zürich Keynote
gr2m
93
13k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
248
20k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
24
1.8k
Designing on Purpose - Digital PM Summit 2013
jponch
113
6.6k
Infographics Made Easy
chrislema
238
18k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3.3k
Docker and Python
trallard
37
2.9k
Large-scale JavaScript Application Architecture
addyosmani
506
110k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
18
1.2k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
16
1.6k
Transcript
位置情報ビッグデータ分析の 舞台裏 望月 優 2017/09/15 Minami Aoyama Night #4
Speaker 望月 優 (もちづき ゆう) • 株式会社ナビタイムジャパン ◦ 2014 年入社
◦ 交通コンサルティング事業 開発リーダー ◦ データ分析業務, データ分析基盤構築業務など
Our Work
Our Company
Our Business
Our Business 交通・地域の最適化によって, 安心して移動できる社会を目指す.
Our Data Resources
Our Data Analysis 分析事例: 交差点通過にかかる所要時間 第 34 回交通工学研究発表会 論文: http://consulting.navitime.biz/pdf/m
onograph_20140807.pdf 発表資料: http://consulting.navitime.biz/pdf/p resentation_20140807.pdf
Our Data Analysis 分析事例: 目的地アソシエーション分析 第 12 回観光情報学会全国大会 論文: http://consulting.navitime.biz/pdf/mon
ograph_20161105_1.pdf 発表資料: http://consulting.navitime.biz/pdf/pres entation_20161105_1.pdf
Our Data Analysis 分析事例: 訪日外国人の滞在先分析 第 12 回観光情報学会全国大会 論文: http://consulting.navitime.biz/pdf/mon
ograph_20150619_01.pdf 発表資料: http://consulting.navitime.biz/pdf/pres entation_20150619_01.pdf
Infrastructure for Analysis
Analysis Flow • SQL-Based Analysis Log Collection Preprocessing Analysis Environment
Software Infrastructure
Spatial Operations • GIS (Geographic Informaton Systems) ◦ 地理情報システム. 地理情報をうまいこと取り扱う枠組みを指す
. ▪ 作成する, 保存する, 描画する, 演算する, etc. ◦ しばしば利用されるベクタ表現方法 ▪ 位置は緯度・経度を座標として表現される . ▪ 地域の形状はポリゴンとして提供される . • たとえば: http://nlftp.mlit.go.jp/ksj/gml/datalist/KsjTmplt-N03-v2_3.html ◦ 参考) http://www.gsi.go.jp/GIS/whatisgis.html
Spatial Operations • PostGIS, or other GEOS Bindings ◦ Shapely,
for Python
Visualization • QGIS, for Reporting
Visualization • QGIS Web Client, for Interactive Reporting
Visualization • Original Web Systems, in the NEAR FUTURE
Development
位置データの意味付け • 位置の意味付け ◦ 住所 / 地域メッシュ ◦ どの施設 /
どの道路 • 移動の意味付け ◦ 移動しようとした / 移動しようとしたが結局しなかった / 実際に移動した ◦ 通過した / しばらく滞在した / 住み着いた ◦ 順調に通過した / 通過に苦労した ◦ どこから来た / どこへ行った
技術的困難 • 空間演算は高コスト ◦ ポリゴンの辺が増えるほど , なにかと遅くなる. ◦ 特にビッグデータなので結構シビア .
• 時系列を追う処理の実装が高コスト ◦ ある 1 点だけでなく, 前後の点列も含めて考える必要がある . ◦ SQL だけで実現するのは到底無理 . ◦ SQL だけで書けないと営業メンバが困る .
空間演算の高速化 • Simplifying Polygons ◦ ポリゴンを簡略化して頂点を減らす . ◦ GEOS でアルゴリズム提供
. PostGIS では ST_Simplify 系関数で実現可. ◦ 実装を変更せずに簡単に実現できる . 地図出典: 国土数値情報 http://nlftp.mlit.go.jp/ksj/
空間演算の高速化 • Spatial Indexing ◦ 簡単な計算で, 確実にマッチしないポリゴンを省く . ◦ Bounding
Box を利用した R-tree が有名. ▪ ネイティブライブラリがあります . ▪ Python Binding もあります. 引用: https://ja.wikipedia.org/wiki/R%E6%9C%A8
空間演算の高速化 • Geohashing ◦ 緯度経度から簡単に計算できるハッシュ値 に変換する. ▪ GeoHash, 地域メッシュコードなど .
◦ Polygon 簡略化の一種であり , Spatial Indexing ともいえる. ◦ ポリゴン計算が一切省かれるので , 高速か つ実装が容易. 地図出典: 国土数値情報 http://nlftp.mlit.go.jp/ksj/
時系列データ処理のスケールアウト • MapReduce でストリーム処理させる. ◦ Reduction において, キーでまとめて時間でソートする . ▪
ソートは勝手に行われないので忘れずに . ▪ ただし対象はビッグデータなので , メモリを使いすぎないよう気をつける . ◦ 特定のキーでまとめるところは共通化できるので , フレームワーク化しておく .
システム化 • 難しいことは SQL ではなく事前計算で Log Collection Preprocessing Analysis Environment
Software Infrastructure 可能な限り事前計算で吸収する
データ商材の育成ポイント SQL でできることを増やせば, プロトタイピングの速度が上がる Log Collection Preprocessing Analysis Environment Software
Infrastructure つまりここが大事!
Thank You!