Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データ民主化を推進するモンストでのLooker導入【MIXI TECH CONFERENCE 2023】

データ民主化を推進するモンストでのLooker導入【MIXI TECH CONFERENCE 2023】

MIXI TECH CONFERENCE 2023
にてお話した吉野の発表資料です。

動画:https://youtu.be/L87pW0Xq-4Q
セッション詳細:https://techcon.mixi.co.jp/2023/d1-6

MIXI ENGINEERS

March 01, 2023
Tweet

Video

More Decks by MIXI ENGINEERS

Other Decks in Technology

Transcript

  1. ©MIXI 解析グループの主な役割 ②課題整理 ⑦BI化 ①分析依頼の受注 ③追加の仮説立て ④仮説検証 ⑤レポーティング ⑥報告 ②インフラ整備

    ⑦保守・運用 ①分析要件の確認,調査 ③データ取得 ④DWH取込 ⑤データマート構築 ⑥データ品質管理 データ分析・可視化 データ基盤開発・運用
  2. ©MIXI ▪ 〜2019年 データ基盤はAWS、分析にはRedshiftを利用 BIはZeppelin, Redash, Metabase, 内製ダッシュボードなど複数のツー ルを併用 ▪

    2020年頃 BigQueryへの移行、同時期にLookerの導入 ▪ 2021年〜 BigQueryへの移行完了、Redshift停止、BIはLookerに統一 データ基盤の変遷
  3. ©MIXI どれも一長一短あり、統一出来なかった (Zeppelin, Redash, Metabase, 内製ダッシュボード) →ユーザーは何を見れば良いか混乱 各ツールのメンテナンス、開発 →エンジニアの開発コスト増 ツール毎にユーザー管理が別々

    →管理コスト増 ①データ分析や可視化のツールが統一されていない こちらの画像は Apache 2.0ライセンス(http://www.apache.org/licenses/LICENSE-2.0) で配布されている製作物が含まれています。
  4. ©MIXI • ツールや分析者が異なれば、集計クエリは乱立していく ◦ 結果、KPI定義がずれることも・・ • 集計クエリを再利用するための仕組みも整っていなかった ◦ 車輪の再発明 ◦

    SQLはそもそも再利用が難しい言語 • 集計クエリの信憑性の担保 ◦ テーブル定義変更などによるメンテナンスコストの増大 ◦ SQLレビュー(SQLは人によってクセがあるので難しい) ②集計クエリの管理や信憑性の担保が困難
  5. ©MIXI • アナリスト、エンジニアでないと難しい ◦ テーブル理解やメタデータ不足 ◦ 慣れていないとBigQueryへの大量スキャンが走ってしまう可能性も・・ • SQLを書ける人がそもそもいない ◦

    SQLは難しい ◦ テーブルの性質まで理解してSQLを書ける人は少ない  →エンジニアやアナリストに依頼が集中する ③データ活用の敷居の高さ
  6. ©MIXI • 基本はSQLを書かないでLookMLでコーディング • SQLの各フィールドをMeasure(集計関数)とDimension(グループ化 可能なフィールド)として定義、Viewに内包 LookMLによる集計定義管理 SELECT DATE(created_at ,

    'Asia/Tokyo') AS date, COUNT(DISTINCT user_id) AS count_login_uu FROM mixi_tec.looker_demo WHERE DATE(created_at , 'Asia/Tokyo') BETWEEN '2023-02-01' AND '2023-02-28' GROUP BY date ORDER BY date
  7. ©MIXI 定義の再利用とメンテナンス性向上 LookML 集計定義 Dashboard A Dashboard B Dashboard C

    Developer 定義変更はLookML の修正のみ • 集計定義は再利用して複数のダッシュボードに利用 • テーブル定義や集計定義の変更はLookML修正のみ 集計定義は再利用
  8. ©MIXI GitHubでのバージョン管理、Pull Request統合 Production Branch Pull Request Pull Developer Reviewer

    Review, Approve Webhook Deploy Looker GitHubでバージョン管理、Pull Requestでレビューフローの確立
  9. ©MIXI ディメンション SQL不要な探索的な分析を可能に 課金 ログイン クエストプレイ ガチャプレイ キャラ育成 行動セグメント ユーザーグレード

    インストール日 ユーザ属性 ファクト • ファクト 事実、イベント • ディメンション 分析の観点、切り口 • テーブル理解、SQLスキルがなくても誰でも分析が可能に ◦ 利用者は裏側のSQL理解が不要
  10. ©MIXI • LookMLの学習コスト、メンバー育成 ◦ Developerスキルのバラつき ◦ 新規導入する際の実装コストの高さ • Viewが増えすぎてゴチャゴチャしてきた ◦

    ちゃんとLookML設計をしないとカオス ◦ 定期的にリファクタリング必要 • Lookerを見る人への配慮は必要 ◦ 見方の説明、トレーニング実施、情報の整理 課題に感じること