Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GPSデータを使った 人の移動の可視化

GPSデータを使った 人の移動の可視化

2020/5/29(金)に開催したExploratory データサイエンス勉強会#13のレイ・フロンティア株式会社のご登壇資料です。

Ikuya Murasato

May 29, 2020
Tweet

More Decks by Ikuya Murasato

Other Decks in Business

Transcript

  1. GPSデータを使った
    人の移動の可視化
    レイ・フロンティア株式会社
    久保 翔太

    View Slide

  2. 自己紹介
    • ソーシャルゲーム開発(プログラマ)
    • 位置情報サービス(プログラマ)
    • ソーシャルゲーム運営(データアナリスト)
    • ギャル向けEC(データアナリスト)
    • 位置情報サービス(データアナリスト) ←今ココ

    View Slide

  3. 会社紹介

    View Slide

  4. アプリ紹介

    View Slide

  5. 位置データの特徴
    lat lon
    35.68574 139.764389
    35.68577 139.7635803
    35.67529 139.7724915
    35.67607 139.769577
    一人あたりのデータ量が多い
    数字だけではデータの
    特徴が分かりづらい

    View Slide

  6. 主な業務
    • BtoBでの分析データ提供
    • ブログを通じた分析データの社会への還元
    • 社内データを分析して新プロダクトの開発

    View Slide

  7. Exploratory導入前の分析ワークフロー
    データアクセス データの加工 共有方法
    データの可視化

    View Slide

  8. データアクセス
    • セキュリティの要件上ローカルにCSVを置きたくないためDBの
    コネクタが必要。(メモリ上ならokというポリシー)
    • Athena(ODBC)をサポートしているBIは少ない

    View Slide

  9. データの加工
    • Excelだと加工の過程が不明
    • 間違いが混入している時に出戻りが大きい
    • シニアメンバーがチェックする時に確認しづらい

    View Slide

  10. データの可視化
    lat lon
    35.68574 139.764389
    35.68577139.7635803
    35.67529139.7724915
    35.67607 139.769577
    地理情報は生データでは規則性を見出しづらい
    可視化するとわかりやすい

    View Slide

  11. 共有方法
    • PowerPoint
    • データを二次利用しにくい
    • Google spreadsheet
    • Excelより表現力に劣る
    • 共有の手続きが面倒

    View Slide

  12. なぜExploratoryか?
    • AWS Athenaへのコネクタがある
    • ローカルにCSV置いておくとポリシー上不都合
    • デフォルトの色合いがきれい
    • Excelなんかのグラフはどぎつい
    • データ加工の過程が見れる
    • シニアメンバーが確認する時に便利
    • 地図描画が使える
    • 市町村レベルの多角形が描ける

    View Slide

  13. Exploratory導入後のワークフロー
    ワンストップ
    データアクセス データの加工 共有方法
    データの可視化

    View Slide

  14. 事例:人流密集地域の発見

    View Slide

  15. モチベーション
    • COVID-19の警戒区域情報を自治体に提供して、密集施設に人が
    行かないようにしたい
    →勘に頼らずデータドリブンな施策決定の手助けに

    View Slide

  16. 緯度、経度
    位置情報の例

    View Slide

  17. 素直にプロット

    素直にプロットする
    →密度がわからない

    View Slide

  18. ヒートマップ
    →赤すぎる
    ヒートマップの利点:
    密度が可視化される
    →まだ赤すぎてどこが本
    当に密集しているのかわ
    かりにくい

    View Slide

  19. 濃さを調整

    View Slide

  20. 「パラメータ」機能で時間帯ごとに切り替え可能に

    View Slide

  21. 時間帯別の比較

    View Slide

  22. ヒートマップまとめ
    • 密度を可視化する事によって、街の中心部のような自明な密集
    地以外の警戒地点が明らかに

    View Slide

  23. 事例:繁華街にはどこから集まっている?

    View Slide

  24. モチベーション
    • 緊急事態宣言のちょっと前のはなし
    • 繁華街(歌舞伎町)に集まっている人がどこから来ているかを
    調べて人の傾向の理解に繋げたい

    View Slide

  25. 歌舞伎町をポリゴンで指定

    View Slide

  26. テーブルのプレビュー

    View Slide

  27. コロプレス(塗り分け)図
    県別 市区町村別

    View Slide

  28. 人口多いところか
    ら来た人は多い→当
    たり前

    View Slide

  29. ちょっとひと工夫:
    • 人口比で出したい

    View Slide

  30. データカタログからインポート

    View Slide

  31. 人口データと結合

    View Slide

  32. View Slide

  33. 結果
    • 新宿以外でどこから来ている人が多いかを可視化できた

    View Slide

  34. まとめ
    • ワークフローの変化によるメリット
    • 一本化した事による作業時間のオーバーヘッドの削減
    • ツールごとの情報ロスがなくなった事による分析品質の向上
    • Exploratoryはコーディング無しで十分な品質の可視化が可能

    View Slide