Upgrade to Pro — share decks privately, control downloads, hide ads and more …

“JapanTaxi” アプリを支える データ分析基盤

Shuichiro Aiba
September 19, 2018

“JapanTaxi” アプリを支える データ分析基盤

2018/9/19の Google Cloud Next '18 in Tokyo の講演資料です。

Shuichiro Aiba

September 19, 2018
Tweet

Other Decks in Technology

Transcript

  1. データ分析チームのミッション データ活用に よる サービス開発 意思決定支援 のための データ構築 需要予測による AI 配車、

    配車ロジック最適化、 データセンシング、など 分析データの整備と基盤構築、 レポーティング、施策分析、など 本日はこちらメイン
  2. データ分析基盤の構成 他クラウド サービス 社内メンバ AWS Kinesis AWS S3 DB Bigquery

    PubSub Dataflow Strage App Engine Tableau SQL Slack spread sheet 外部サービス DataLab データソース データ転送 データ 保存 / 処理 データ出力/利用
  3. データ分析基盤の利用 データ分析基盤 セールス マーケティング 開発 ・地域のデータ ・タクシー会社のデータ ・アプリの利用状況 ・ボトルネック調査 ・不具合調査

    ・広告トラッキング ・ユーザ特性 システム ・外部サービスへの  データ連携 経営層 ・KPI 等の重要数値確認 分析 ・依頼ベースの分析 ・データ活用施策の  前処理 / 事前分析
  4. 組織による分析軸の違い セールス • 時系列 • 会社 • 地域 分析 •

    時系列 • 地域 • ユーザ • 流入 • 時系列 • 機能 • ユーザ • シナリオ マーケティング 開発
  5. データの集約と共有 • 層を分けて社内提供 生データ系 Dataset 汎用分析用 Dataset アプリケー ション用 Dataset

    ・不要情報削除 ・重複除去 ・非正規化 ・データ間結合 目的に応じた集計 元データ クエリ クエリ 主にこれを公開 全件 or 差分 Tableau Online などシステム 元データ 元データ
  6. 組織ごとのセルフ分析のために • Betaの機能も積極的に使って性能・コストを最適化 Partitioned Table (based on TIMESTAMP column) Clustered

    Table Ingestion time TIMESTAMP or DATE columns フィルタリングや集 計によく利用される 軸=カラム 利用者が意識しなくとも最適化される