Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
“JapanTaxi” アプリを支える データ分析基盤
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Shuichiro Aiba
September 19, 2018
Technology
3
1.4k
“JapanTaxi” アプリを支える データ分析基盤
2018/9/19の Google Cloud Next '18 in Tokyo の講演資料です。
Shuichiro Aiba
September 19, 2018
Tweet
Share
Other Decks in Technology
See All in Technology
類似画像検索モデルの開発ノウハウ
lycorptech_jp
PRO
5
1.1k
kintone開発のプラットフォームエンジニアの紹介
cybozuinsideout
PRO
0
860
[JAWSDAYS2026][D8]その起票、愛が足りてますか?AWSサポートを味方につける、技術的「ラブレター」の書き方
hirosys_
3
120
クラウド × シリコンの Mashup - AWS チップ開発で広がる AI 基盤の選択肢
htokoyo
2
180
PMBOK第8版は第7版から何が変わったのか(PMBOK第8版概要解説) / 20260304 Takeshi Watarai
shift_evolve
PRO
0
200
聲の形にみるアクセシビリティ
tomokusaba
0
170
脳内メモリ、思ったより揮発性だった
koutorino
0
220
タスク管理も1on1も、もう「管理」じゃない ― KiroとBedrock AgentCoreで変わった"判断の仕事"
yusukeshimizu
5
2.6k
アーキテクチャモダナイゼーションを実現する組織
satohjohn
0
260
最強のAIエージェントを諦めたら品質が上がった話 / how quality improved after giving up on the strongest AI agent
kt2mikan
0
160
Shifting from MCP to Skills / ベストプラクティスの変遷を辿る
yamanoku
4
810
Oracle Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
5
1.2k
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.5k
How to train your dragon (web standard)
notwaldorf
97
6.6k
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
180
Game over? The fight for quality and originality in the time of robots
wayneb77
1
130
Optimizing for Happiness
mojombo
378
71k
Building Adaptive Systems
keathley
44
3k
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
140
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
A better future with KSS
kneath
240
18k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
480
Transcript
D1-1-S07 “JapanTaxi” アプリを支える データ分析基盤 饗庭 秀一郎 JapanTaxi 株式会社 データエンジニア 饗庭
秀一郎 2018 年 9 月 19 日
目次 • JapanTaxi と分析チームの紹介 • 社内分析基盤の紹介 • 分析基盤の運用方法 • 今後の
GCP の活用
JapanTaxi
データ分析チームのミッション データ活用に よる サービス開発 意思決定支援 のための データ構築 需要予測による AI 配車、
配車ロジック最適化、 データセンシング、など 分析データの整備と基盤構築、 レポーティング、施策分析、など 本日はこちらメイン
サービスの仕組み サーバサイド 配車システム ドライバー用アプリ JapanTaxi タクシー会社
分析に使うデータ 配車情報 決済情報 車両位置情報 アプリログ 広告 トラッキング ユーザ情報
データ分析基盤の構成 他クラウド サービス 社内メンバ AWS Kinesis AWS S3 DB Bigquery
PubSub Dataflow Strage App Engine Tableau SQL Slack spread sheet 外部サービス DataLab データソース データ転送 データ 保存 / 処理 データ出力/利用
GCP を使っている理由 • データ蓄積と処理の基盤となる BigQuery のメリット享受 パフォーマ ンス 運用 新機能
データ分析基盤の利用 データ分析基盤 セールス マーケティング 開発 ・地域のデータ ・タクシー会社のデータ ・アプリの利用状況 ・ボトルネック調査 ・不具合調査
・広告トラッキング ・ユーザ特性 システム ・外部サービスへの データ連携 経営層 ・KPI 等の重要数値確認 分析 ・依頼ベースの分析 ・データ活用施策の 前処理 / 事前分析
分析イメージ - セールスによる地域分析 あくまでイメージで実際のデータとは異なります
分析イメージ - ドライバー分析 あくまでイメージで実際のデータとは異なります
組織による分析軸の違い セールス • 時系列 • 会社 • 地域 分析 •
時系列 • 地域 • ユーザ • 流入 • 時系列 • 機能 • ユーザ • シナリオ マーケティング 開発
分析基盤に求められること • あらゆる関連データにアクセスできる ◦ いろんな場所に散在するデータの集約と共有 • すばやく見たい軸で自分で分析できる ◦ 組織ごとの観点での分析 ◦
地理的条件での分析 • 利用状況の客観的把握 ◦ データ保存量、テーブルの利用度 / タイミング
データの集約と共有 • 層を分けて社内提供 生データ系 Dataset 汎用分析用 Dataset アプリケー ション用 Dataset
・不要情報削除 ・重複除去 ・非正規化 ・データ間結合 目的に応じた集計 元データ クエリ クエリ 主にこれを公開 全件 or 差分 Tableau Online などシステム 元データ 元データ
組織ごとのセルフ分析のために • Betaの機能も積極的に使って性能・コストを最適化 Partitioned Table (based on TIMESTAMP column) Clustered
Table Ingestion time TIMESTAMP or DATE columns フィルタリングや集 計によく利用される 軸=カラム 利用者が意識しなくとも最適化される
地理的条件での分析 - GIS • 例:タクシー営業区域で集計可(行政区で構成される) 地域メッシュ 行政区域
利用状況の客観的把握 • GCP Census (OSS) でテーブル情報を日次で取得
利用状況の客観的把握 • クエリなどのジョブ情報を API から収集して管理
今後の GCP の活用 - ML 系サービスの活用 • VisionAPI, AutoML ドライブレコーダーの
映像解析による 車両のラベリングなど
一緒に働く仲間を募集しています データ分析 デザイナー セールス マーケティング フロントエンド サーバサイド ハードウェア コーポレート