Upgrade to Pro — share decks privately, control downloads, hide ads and more …

KPI Management with AWS

KPI Management with AWS

AWS Startup Day Tokyo 2018にて

y_matsuwitter

March 13, 2018
Tweet

More Decks by y_matsuwitter

Other Decks in Programming

Transcript

  1. 2 ©Gunosy Inc. ⾃⼰紹介 n Gunosy Inc. – 新規事業開発室 執⾏役員

    CTO n 業務 – 開発全般のマネジメント – 技術に関する横断的な課題対処 – 現在は新規事業⽴ち上げも担当 n 経歴 – 在学時に⼆社のベンチャーの⽴ち上げ・ 開発に携わる – 2013年3⽉ 東京⼤学⼯学部卒業 – 2013年1⽉よりGunosyに⼊社 – 2014年6⽉執⾏役員就任、現在に⾄る 松本 勇気 @y_matsuwitter
  2. 4 ©Gunosy Inc. 株式会社 Gunosy 企業理念「情報を世界中の⼈に最適に届ける」 n 2012年11⽉創業 n 2015年4⽉東証マザーズ上場

    n 2017年12⽉東証第⼀部に市場変更 n 従業員数 130名 (2017年11⽉末現在 連結ベース) n 事業内容 – 情報キュレーションサービス、および その他メディアの開発運営 東⼤院⽣3⼈が創業、現在6期⽬。
  3. 6 ©Gunosy Inc. Gunosyという組織 開発組織全体で60名程度、下記の1ユニットが2~10名程度の構成。 グノシー ニュースパス LUCRA Game8 新規事業

    R&D Ad Tech + Digwell SRE 開発チーム Design QA Data Analysis 開発チーム 開発チーム 開発チーム 開発チーム 開発チーム
  4. 9 ©Gunosy Inc. Gunosyの成⻑と数値経営 KPI = 経営状態に対する診断装置 n 創業時からの社訓 –

    「数値は神より正しい」 n クリックのみならずすべてのアクションを計 測可能にしてきた。 – グノシーを起動すると数⼗のログが即座 に⽣成される。 – e.g. ⽬にした記事のIDなど。 n SQLを通じて全社員が仮説を探し、検証でき る体制がある。 創業当時から、KPI計測を中⼼に据えた経営を推し進めていた。 意思決定 DAU Sales RR Click PV CPA
  5. 10 ©Gunosy Inc. KPI経営 誰でも改善内容を理解出来る仕組みが組織とプロダクトの拡⼤に繋がる。 n 科学的⼿法 – 測定可能性 –

    定量性 – 再現性 – 統計的有意性 – 論理的整合性 n 施策の影響を数値として計測、対照実験して いくことで着実な成⻑を作る。 n 誰でも運⽤可能な再現性のあるノウハウを蓄 積していく。 ユーザーと売上、利益をつなげる科学的⼿法。 計測 課題 仮説 検証 ノウハウ・知⾒ ノウハウ・知⾒ ノウハウ・知⾒
  6. 11 ©Gunosy Inc. KPI経営のために必要なこと 活⽤可能なデータの量が意思決定の精度を上げていく。 n すべてのアクションを⽐較・計測 – アプリやWeb、プロモーション時などす べてのアクションをログとして計測。

    – ABテストによる性能⽐較。 n データのアクセシビリティ担保 – 誰もが同じデータを同じ基準で集計。 – 分析基盤とSQL、可視化ツール導⼊。 n KPI構造の探索と理解 – 各アクションが最終KPIに及ぼす影響を 明確にする。 データを計測し、アクセスし、可視化し、⽐較する。 データ分析 基盤 BIツール ロジック ログ計測 ビジネス 理解 サービス 運営チーム
  7. 13 ©Gunosy Inc. 再現性と技術 サービス・組織の成⻑に柔軟について来れる基盤が求められる。 n プロダクト成⻑に伴いデータ量は劇的に増加 していく。 – TBクラスのデータに簡単に集計がかけ

    られる仕組みが必要 n 組織の成⻑に伴い、想定されない使い⽅をさ れうる。 – サービス運⽤の安定性と分析が切り離さ れている必要がある。 n 数値分析を専⾨職に留めない – 誰もが利⽤・追加できるKPIダッシュボ ード、数値の共有環境 再現のある数値の運⽤にはデータ基盤の技術が不可⽋。 データ分析 基盤 ⼤量のイベントログ 様々な分析利用者
  8. 15 ©Gunosy Inc. 機械学習 分析・共有 ストリーム処理 バッチ処理 データ分析基盤とAWS S3を中⼼にしたエコシステムを構築し、運⽤しやすくスケーラブルな基盤へ。 Amazon

    Athena Amazon EMR Amazon Redshift* Amazon Kinesis Streams Amazon RDS AWS Lambda Amazon ECS 広告配信 記事配信 Kinesis Streamでイベント収集 Lambdaで永続化
  9. 16 ©Gunosy Inc. 機械学習 分析・共有 ストリーム処理 バッチ処理 データ分析基盤とAWS S3を中⼼にしたエコシステムを構築し、運⽤しやすくスケーラブルな基盤へ。 Amazon

    Athena Amazon EMR Amazon Redshift* Amazon Kinesis Streams Amazon RDS AWS Lambda Amazon ECS 広告配信 記事配信 各サービスのDBをECS上で Digdag経由でDump S3へ保存
  10. 17 ©Gunosy Inc. 機械学習 分析・共有 ストリーム処理 バッチ処理 データ分析基盤とAWS S3を中⼼にしたエコシステムを構築し、運⽤しやすくスケーラブルな基盤へ。 Amazon

    Athena Amazon EMR Amazon Redshift* Amazon Kinesis Streams Amazon RDS AWS Lambda Amazon ECS 広告配信 記事配信 S3上のデータ(parquet等)は EMRやAthena、Redshiftを 通じて分析・可視化
  11. 19 ©Gunosy Inc. 施策の⼿数を増やすために 技術的レールの整備 新技術の調査・導⼊ 同じ技術の利⽤は最短経路で よりよい解を探す n Infrastructure

    as Code – アーキテクチャ共通化によるベス ト・プラクティスの共有 – アプリケーションエンジニアによ るインフラ構築 n 新規プロジェクトには常に1つ以上新 技術を取り⼊れる。 – 既存のベストプラクティスを更新 しうるか調査 n プロダクション運⽤可なら左記と同じ くコードによる共通化・各所展開 仮説を⾒つけ、試すための⼟台を社内全体で洗練させ続ける。 仮説検証のサイクルを早めるために開発効率を⾼め続ける。
  12. 20 ©Gunosy Inc. 社内におけるツールの共通化施策 Infrastructure as Codeで共通な仕組みを即座に展開。 n Opsworksによるインフラの共通化 –

    GUIで多くの構築作業が可能。 – デプロイ等の仕様すべてがコードで記述 されており、サービス⽴ち上げ時はそれ に従えば即リリースへ。 n データフロー設計の共通化 – Kinesis streamを中⼼にした、アプリ側 まで含めた設計を各所で利⽤。 – 可視化含め、どのサービスも共通のアー キテクチャであり分析も近しい。 個⼈的に「レールを引く」と呼んでいる。 AWS OpsWorks Service A Service B 社内 Best Practices Chef Recipe 各所適用
  13. 21 ©Gunosy Inc. 新技術に取り組むために 利点・⽋点等の特性を理解し、常に挑戦し続ける。 n オフラインに対して適⽤できるもの – ひとまず既存データに対して適⽤検討 –

    AWSの新製品だとリージョンが異なっ ていてもサービス影響⼩さいため試⽤ n 事例:AWS Athena – S3上のログデータをそれまで⾃前の Presto等で運⽤していた。 – ⼀部データをusリージョンに転送し、 Athenaを試⽤、そのまま運⽤へ。 n オンラインでも、ロールバック可能性を担保 できるケースでは運⽤へつなげる。 積極的にプロダクト設計に取り⼊れリリースしている。 ap-northeast-1 us-east-1 Amazon Athena S3 S3 両リージョンに書き込み利用
  14. 23 ©Gunosy Inc. まとめ すべての意思決定は数値に基づく l ユーザーのアクティビティや売上の関係を数値で表現できると ころまで構造を理解 l 全メンバーが仮説を掘り下げられる環境を作る。

    KPIに触れるデータ環境の頑健さをS3中⼼のアーキテクチャで l Kinesis Stream、Lambda、Athena、EMR等を組み合わせるこ とで、分析環境はスケーラブルかつ運⽤コスト削減 仮説検証の速度をコード化と新技術採⽤で上げる l Infrasturcture as Codeによるベストプラクティス共有 l よりよいベストプラクティスの探求 Gunosyで実践してきたKPI経営とそれに対する技術の関係について。