Minami Aoyama Night#4での発表資料です。
位置情報ビッグデータをインタラクティブに分析できるようになるまで株式会社ナビタイムジャパン交通コンサルティング事業部塚本 周平1
View Slide
自己紹介2
自己紹介塚本 周平株式会社ナビタイムジャパン● 交通コンサルティング事業部● 2016年入社● プログラマー○ データ分析, データ分析アプリケーション開発 etc...3
交通コンサルティング事業紹介4
交通コンサルティング事業紹介5
交通コンサルティング事業紹介業務事例● 主なクライアント○ 官公庁○ 自治体○ 道路事業者○ 公共交通事業者○ 大学○ コンサルタント○ etc...6
分析事例● 経路検索条件データ○ 検索ログをアソシエーション分析○ アウトレット間の競合関係を可視化交通コンサルティング事業紹介[ 発表先 ] 第54回土木計画学研究発表会論文:http://consulting.navitime.biz/pdf/monograph_20161105_1.pdf発表資料:http://consulting.navitime.biz/pdf/presentation_20161105_1.pdf7
分析の進め方8
● 仮説検証サイクルを繰り返す事で分析を行う○ サイクルを繰り返すほど分析が深度化分析の進め方データ作成仮説立案可視化検証交通コンサルタントによる仮説設定ビッグデータから分析対象を抽出データのグラフ化 /地図上へ描画仮説の妥当性を検証できる限り高速にサイクルを回したい9
● 工程ごとに要求されるスキルセットが異なる仮説立案 データ作成可視化検証Data EngineersDataVisualizationEngeneersData Scientists分析の進め方10
● 受注業務の場合、クライアントと分析要件の調整が必要分析の進め方Clients11
● 分析業務をクライアントが行う場合も、営業工数が発生仮説立案 データ作成可視化検証Data EngineersDataVisualizationEngeneersClients分析の進め方Sales12
分析の進め方ボトルネック● エンジニアリングコスト● 営業コスト● チーム内のコミュニケーションコスト● クライアントとの調整コスト13
クライアントが、データホルダーのように自由に分析できるシステムを作りたい仮説立案 データ作成可視化検証DataAnalyzingSystemClients /Data Scientists分析の進め方14
システム化検討15
システム化検討「仮説立案」・「検証」以外のコストを無くす● 「データ作成」・「可視化」を、ワンストップアプリケーション化○ プログラミングレスで分析可能● アプリケーションをクライアントが直接利用可能○ データホルダーのように自由に分析可能16
システム化検討機能要件● インタラクティブ性○ クライアントがGUIから任意に選択した条件でデータ分析を実施● 大容量データ描画○ 日本全国の道路ネットワークデータを地図上に描画● 高速集計○ ユーザーが待てる時間内に描画データを集計17
システム化検討技術課題● 地図描画○ インタラクティブ性○ 大容量データ描画● 高速集計○ 処理リードタイム○ 安定性○ 運用費18
System Architectureシステム化検討ClientMap Server Data Server19
技術検討- 地図描画編 -20
技術検討 - 地図描画編 -技術課題● インタラクティブ性○ クライアントがGUIから任意に選択した条件でデータ分析を実施● 大容量データ描画○ 日本全国の道路ネットワークデータを地図上に描画21
技術検討 - 地図描画編 -QGIS● 幅広い位置情報データ形式に対応○ Shape File, csv, Spatial database etc...● WMS形式での地図配信が可能○ QGIS Web● 社内利用実績有り○ 大容量データもある程度表示可能× インタラクティブな 地図描画形式には未対応22
技術検討 - 地図描画編 -Raster Tiles● タイル形式● 画像データ○ png, jpeg etc...● ブラウザに表示される● データのみ配信× 地図上の道路データに対し イベント登録ができない23
技術検討 - 地図描画編 -GeoJSON● 空間データをJSON形式で記述● イベント登録可能○ 地物(道路や建物データ)をsvgやcanvasの要素として○ を扱う事ができる× 大容量データを描画できない{"type": "Feature","geometry": {"type": "Point","coordinates": [125.6, 10.1]},"properties": {"name": "Dinagat Islands"}}24
技術検討 - 地図描画編 -こんなデータ形式があれば・・・● Raster Tilesのように、画面上に表示するデータのみ配信● GeoJSON(+JavaScript)のようにHTMLの要素として地図データを扱える25
技術検討 - 地図描画編 -あった!26
技術検討 - 地図描画編 -Vector TilesGvunAngCCgtsaW5rLW1hc3RlciiAIBoIY2FyX29ubHkiAiAAGglkZXN0X25vZGUiAiBCGglkdWFsX2xpbmsiAiBtGg1sYW5lX251bV9jb2RlIgIgAhoGbGVuZ3RoIgIgShoEbGluayIDIKAdGglsaW5rX3R5cGUaCmxpbmtfdH27
技術検討 - 地図描画編 -Vector Tiles● ブラウザに表示されるデータのみ配信● Javascriptの地図ライブラリ等を用いて地図上に可視化○ Leaflet, OpenLayers etc...● イベント登録可能○ SVBやCanvasの要素として地物を扱う事ができる◎ インタラクティブ性◎ 大容量データ描画28
地図配信形式にVector Tilesを採用技術検討 - 地図描画編 -インタラクティブ性 大容量データ描画QGIS × △Raster Tiles × ○GeoJSON ○ ×Vector Tiles ○ ○29
技術検討 - 地図描画編 -Amazon RDS for PostgreSQL● 描画用データの格納● PostgreSQL上で空間演算できるPostGISを利用● 将来的にAWS Aurora for PostgreSQLに移行したい○ ダウンタイム無しで拡張可能○ 処理性能向上○ 東京リージョンでは未公開30
System Architectureシステム化検討ClientMap ServerVector TilesMap DB ServerData Server31
技術検討- 高速集計編 -32
技術検討 - 高速集計編 -前提● Javaで書かれた処理とSQLで書かれた処理が存在する○ それぞれが動く分散処理環境が必要● リクエストを常に待ち受ける必要有り要求● リードタイム低● 運用費安33
技術検討 - 高速集計編 -Java分散処理フレームワーク34
技術検討 - 高速集計編 -Hadoop● 言わずと知れた分散処理FW● 社内実績多数× ジョブ毎にI/Oオーバーヘッド が発生 リードタイムが要求に満たない35
技術検討 - 高速集計編 -Spark● Hadoopに次ぐ分散処理FWの雄● インメモリ処理のためI/Oオーバーヘッド低減◎リードタイム低△常時インスタンスを起動する 必要有り36
● Java分散処理にSparkを採用技術検討 - 高速集計編 -リードタイム 運用費JavaHadoop △ △Spark ○ △37
技術検討 - 高速集計編 -SQL分散処理フレームワーク38
技術検討 - 高速集計編 -Hive● hadoopクラスタ上で動作● HiveQLと呼ばれるSQLライクな言語を使用● 社内実績多数× hadoop同様、 リードタイムが要求に満たない39
技術検討 - 高速集計編 -Presto● Facebook社が開発した高速分散DB● ANSI SQL 標準をサポート● HDFSやAmazon s3上のデータを処理可能○ Hiveと同一データソースを利用できる◎ リードタイム低△ インスタンスを常時起動する 必要が有るため、運用費高40
技術検討 - 高速集計編 -Amazon Athena● Amazon AWS上で利用できる高速分散DB○ 実行エンジンにPrestoが採用されている● Amazon s3上のデータを処理可能● クエリ課金○ インスタンスを常時起動する必要が無い◎ リードタイム低◎ 運用費低41
● SQL分散処理にAmazon Athenaを採用技術検討 - 高速集計編 -リードタイム 運用費JavaHadoop △ △Spark ○ △SQLHive △ △Presto ○ △Amazon Athena ○ ○42
システム化検討System ArchitectureClientMap ServerVector TilesData ServerMap DB Server Data Store43
道路プロファイラー44
道路プロファイラー45
道路プロファイラー利用データ46
論文発表道路プロファイラー[ 発表先 ]第55回土木計画学研究発表会論文:http://consulting.navitime.biz/pdf/monograph_20170610_1.pdf発表資料:http://consulting.navitime.biz/pdf/presentation_20170610_1.pdf 47
道路プロファイラーケーススタディ48
ご清聴ありがとうございました。49