Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
位置情報ビッグデータ分析の舞台裏
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NAVITIME JAPAN
PRO
October 04, 2017
Research
41
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
位置情報ビッグデータ分析の舞台裏
Minami Aoyama Night#4での発表資料です。
NAVITIME JAPAN
PRO
October 04, 2017
More Decks by NAVITIME JAPAN
See All by NAVITIME JAPAN
つよつよリーダーが 抜けたらどうする? 〜ナビタイムのAgile⽀援組織の変遷〜
navitimejapan
PRO
23
16k
実践ジオフェンス 効率的に開発するために
navitimejapan
PRO
3
1.1k
安全で使いやすいCarPlayアプリの 魅せ方:HIGと実例から学ぶ
navitimejapan
PRO
1
290
見えないユーザの声はログに埋もれている! ~ログから具体的なユーザの体験を数値化した事例紹介~
navitimejapan
PRO
6
3.4k
ユーザーのためなら 『デザイン』 以外にも手を伸ばせる
navitimejapan
PRO
2
1.9k
フツーのIT女子が、 Engineering Managerになるまで
navitimejapan
PRO
3
440
不確実性に打ち勝つOKR戦略/How to manage uncertainty with OKR strategy
navitimejapan
PRO
4
4k
アジャイルを小さいままで 組織に広める 二周目 / Agile Transformation in NAVITIME JAPAN iteration 2
navitimejapan
PRO
4
1.5k
変更障害率0%よりも「継続的な学習と実験」を価値とする 〜障害を「起こってはならないもの」としていた組織がDirtの実施に至るまで〜 / DevOps Transformation in NAVITIME JAPAN
navitimejapan
PRO
8
6.1k
Other Decks in Research
See All in Research
機械学習で作った ポケモン対戦bot で 遊ぼう!
fufufukakaka
0
270
2026 東京科学大 情報通信系 研究室紹介 (大岡山)
icttitech
0
3.7k
羽田新ルート運用6年の検証
1manken
0
160
[チュートリアル] 電波マップ構築入門 :研究動向と課題設定の勘所
k_sato
0
480
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
860
Research Engineerという仕事 / Research Engineering: Bridging Research and Business
chck
1
210
量子コンピュータの紹介
oqtopus
0
320
敵対生成プロンプト同時探索による内省型プロンプト最適化
kinoue_smarthr
0
180
LiDAR点群の地表面分類手法の比較・検証
vegapunkhiroshi79
0
120
YOLO26_ Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection
satai
3
800
多様なデータを許容し学習し続ける模倣学習 / Advanced Imitation Learning for VLA
prinlab
0
220
SAKURAONE:An Open Ethernet-based AI HPC System And Its Observed Workload Dynamicsin a Single-Tenant LLM Development Environment
yuukit
1
320
Featured
See All Featured
New Earth Scene 8
popppiees
3
2.3k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
190
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
440
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
300
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
330
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
380
Designing Powerful Visuals for Engaging Learning
tmiket
1
410
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
1.7k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
Transcript
位置情報ビッグデータ分析の 舞台裏 望月 優 2017/09/15 Minami Aoyama Night #4
Speaker 望月 優 (もちづき ゆう) • 株式会社ナビタイムジャパン ◦ 2014 年入社
◦ 交通コンサルティング事業 開発リーダー ◦ データ分析業務, データ分析基盤構築業務など
Our Work
Our Company
Our Business
Our Business 交通・地域の最適化によって, 安心して移動できる社会を目指す.
Our Data Resources
Our Data Analysis 分析事例: 交差点通過にかかる所要時間 第 34 回交通工学研究発表会 論文: http://consulting.navitime.biz/pdf/m
onograph_20140807.pdf 発表資料: http://consulting.navitime.biz/pdf/p resentation_20140807.pdf
Our Data Analysis 分析事例: 目的地アソシエーション分析 第 12 回観光情報学会全国大会 論文: http://consulting.navitime.biz/pdf/mon
ograph_20161105_1.pdf 発表資料: http://consulting.navitime.biz/pdf/pres entation_20161105_1.pdf
Our Data Analysis 分析事例: 訪日外国人の滞在先分析 第 12 回観光情報学会全国大会 論文: http://consulting.navitime.biz/pdf/mon
ograph_20150619_01.pdf 発表資料: http://consulting.navitime.biz/pdf/pres entation_20150619_01.pdf
Infrastructure for Analysis
Analysis Flow • SQL-Based Analysis Log Collection Preprocessing Analysis Environment
Software Infrastructure
Spatial Operations • GIS (Geographic Informaton Systems) ◦ 地理情報システム. 地理情報をうまいこと取り扱う枠組みを指す
. ▪ 作成する, 保存する, 描画する, 演算する, etc. ◦ しばしば利用されるベクタ表現方法 ▪ 位置は緯度・経度を座標として表現される . ▪ 地域の形状はポリゴンとして提供される . • たとえば: http://nlftp.mlit.go.jp/ksj/gml/datalist/KsjTmplt-N03-v2_3.html ◦ 参考) http://www.gsi.go.jp/GIS/whatisgis.html
Spatial Operations • PostGIS, or other GEOS Bindings ◦ Shapely,
for Python
Visualization • QGIS, for Reporting
Visualization • QGIS Web Client, for Interactive Reporting
Visualization • Original Web Systems, in the NEAR FUTURE
Development
位置データの意味付け • 位置の意味付け ◦ 住所 / 地域メッシュ ◦ どの施設 /
どの道路 • 移動の意味付け ◦ 移動しようとした / 移動しようとしたが結局しなかった / 実際に移動した ◦ 通過した / しばらく滞在した / 住み着いた ◦ 順調に通過した / 通過に苦労した ◦ どこから来た / どこへ行った
技術的困難 • 空間演算は高コスト ◦ ポリゴンの辺が増えるほど , なにかと遅くなる. ◦ 特にビッグデータなので結構シビア .
• 時系列を追う処理の実装が高コスト ◦ ある 1 点だけでなく, 前後の点列も含めて考える必要がある . ◦ SQL だけで実現するのは到底無理 . ◦ SQL だけで書けないと営業メンバが困る .
空間演算の高速化 • Simplifying Polygons ◦ ポリゴンを簡略化して頂点を減らす . ◦ GEOS でアルゴリズム提供
. PostGIS では ST_Simplify 系関数で実現可. ◦ 実装を変更せずに簡単に実現できる . 地図出典: 国土数値情報 http://nlftp.mlit.go.jp/ksj/
空間演算の高速化 • Spatial Indexing ◦ 簡単な計算で, 確実にマッチしないポリゴンを省く . ◦ Bounding
Box を利用した R-tree が有名. ▪ ネイティブライブラリがあります . ▪ Python Binding もあります. 引用: https://ja.wikipedia.org/wiki/R%E6%9C%A8
空間演算の高速化 • Geohashing ◦ 緯度経度から簡単に計算できるハッシュ値 に変換する. ▪ GeoHash, 地域メッシュコードなど .
◦ Polygon 簡略化の一種であり , Spatial Indexing ともいえる. ◦ ポリゴン計算が一切省かれるので , 高速か つ実装が容易. 地図出典: 国土数値情報 http://nlftp.mlit.go.jp/ksj/
時系列データ処理のスケールアウト • MapReduce でストリーム処理させる. ◦ Reduction において, キーでまとめて時間でソートする . ▪
ソートは勝手に行われないので忘れずに . ▪ ただし対象はビッグデータなので , メモリを使いすぎないよう気をつける . ◦ 特定のキーでまとめるところは共通化できるので , フレームワーク化しておく .
システム化 • 難しいことは SQL ではなく事前計算で Log Collection Preprocessing Analysis Environment
Software Infrastructure 可能な限り事前計算で吸収する
データ商材の育成ポイント SQL でできることを増やせば, プロトタイピングの速度が上がる Log Collection Preprocessing Analysis Environment Software
Infrastructure つまりここが大事!
Thank You!