Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

全社横断データ活用推進のコツと その負債とのつき合い方

阿部 昌利
November 07, 2024

全社横断データ活用推進のコツと その負債とのつき合い方

2024年10月17日に開催された「Yappli Tech Conference 2024」の発表資料です。

アーカイブ動画:https://www.youtube.com/watch?v=E1sVro3XB8c&t=28s

阿部 昌利

November 07, 2024
Tweet

More Decks by 阿部 昌利

Other Decks in Technology

Transcript

  1. Speaker 開発統括本部 プロダクト開発本部 データサイエンス室 室⻑ 阿部 昌利 • 2020年4⽉にヤプリに⼊社 •

    社会⼈当初からデータサイエンティスト としてキャリアを積む。データ活⽤キャ リア14年⽬
  2. アプリログ Cloud Run, DataFlow, Pub/Sub 社員 顧客 業務の賜物 データ転送 データマート作成

    分析⽤データは BigQueryに集約 社内向け / 社外向け問わず共通のデータ基盤
  3. アプリログ Cloud Run, DataFlow, Pub/Sub 社員 顧客 業務の賜物 データ転送 データマート作成

    データ転送 120 データマート:170 ワークフロー:55 社内向け / 社外向け問わず共通のデータ基盤
  4. 01_全社横断的なデータ活⽤の例 広告効果レポート⾃動化 2 • データ元:AppsFlyer、Apple Search Ads。成果物:Googleスプレッドシート • 作成期間:都度1~2⽇。使⽤年数:2022年12⽉〜 •

    ⽬的:広告運⽤代⾏サービスのレポーティング⾃動化による⼯数削減 • ポイント ◦ データ取得上のAPI制限に引っかかりやすいので、契約や仕様を確認する ◦ 売上拡⼤に貢献しやすいので、提案⽤に別途分析する
  5. 01_全社横断的なデータ活⽤の例 オフィス出社⽇数レポーティング 3 • データ元:Googleドライブ[csvファイル]。成果物:Googleスプレッドシート • 作成期間:5⽇。使⽤年数:2024年2⽉〜 • ⽬的:⽉初に受領する従業員の⼊退館ログの集計⾃動化 •

    ポイント ◦ センシティブなデータなので権限管理を厳密にする ◦ 更新が⽉初の第1営業⽇と、カレンダー上は不規則なので、⼈事担当が TROCCOを⼿動更新する形で運⽤中(ボタンを押すだけなので簡単!)
  6. 01_全社横断的なデータ活⽤の例 新プロダクトのデータ提供 4 • データ元:MySQL。成果物:Looker Studio • 作成期間:1ヶ⽉。使⽤年数:2023年9⽉〜 • ⽬的:新プロダクト「Yappli

    CRM」のアナリティクス提供 • ポイント ◦ サービス⽤のデータベースもTROCCOで簡単に連携 ◦ カスタマーサクセス担当と⼀緒に作成して、まずは社員が利⽤してブラッ シュアップ。それから顧客へ展開
  7. ⼩規模なデータ活⽤の基本的な流れ 02_データ活⽤推進にあたって意識していること 要件を叶えるための データを集める Point 最終的にデータ更新 する場合に、無理な く運⽤できるように ⾒据えておく データ取得

    分析‧アウト プット試作 アウトプット 確定‧作成 ワーク フロー化 試作したアウトプッ トを叩き台に⽤途や 施策を議論 Point 実データを⾒ながら でないと、⼈はイ メージを持つのが難 しい ダッシュボードやア ラートシステムな ど、データ活⽤に必 要な成果物を作成す る Point アクションに直結す る最⼩限のデータに する 定期的にデータを更 新するワークフロー を作成する Point 総じて「あれもこれ も」となりやすい が、⼀番肝となる データからクイック に始める
  8. ⼩規模なデータ活⽤の基本的な流れ 02_データ活⽤推進にあたって意識していること 要件を叶えるための データを集める Point 最終的にデータ更新 する場合に、無理な く運⽤できるように ⾒据えておく 試作したアウトプッ

    トを叩き台に⽤途や 施策を議論 Point 実データを⾒ながら でないと、⼈はイ メージを持つのが難 しい ダッシュボードやア ラートシステムな ど、データ活⽤に必 要な成果物を作成す る Point アクションに直結す る最⼩限のデータに する 定期的にデータを更 新するワークフロー を作成する Point 総じて「あれもこれ も」となりやすい が、⼀番肝となる データからクイック に始める アナリティクス エンジニア リング エンジニア リング データ取得 分析‧アウト プット試作 アウトプット 確定‧作成 ワーク フロー化
  9. ETLツールと分担 02_データ活⽤推進にあたって意識していること 得意 得意 得意 データ取得 分析‧アウト プット試作 アウトプット 確定‧作成

    ワーク フロー化 データ元によって取 得の条件が異なり、 学習コストが高い 安定的に動き、メン テナンスしやすい仕 組みは開発コストが 高い データ活用
 メンバー
 
 
 
 ETLツール

  10. データ 収集 ワーク フロー化 顧 客 顧 客 アウト プット

    社内 ニーズ ヒアリング 相談 1. エンジニアリング ツールの⼒で⼯数を削減しやすい 3. エンジニアリング ツールの⼒で⼯数を削減しやすい 2. アナリティクス エンジニアリング部分を 省⼒化できていれば、こ のパートに注⼒してサイ クルを重ねやすい。その ためのTipsを次ページから 紹介します データ組織の⼈数‧予算拡⼤。更なるデータ活⽤ サイクルが回るに 連れて、社内の⾵向きが だんだん変わる
  11. 無償 有償 CMS ダッシュボード Yappli 管理画⾯のトップに 表⽰されるダッシュボード Yappli Analytics アプリログを網羅した分析や、

    機能別に特化した分析が可能な ダッシュボード。CRM版もあり Yappli Data Hub アプリ内の⾏動データや属性データを ユーザ単位で分析するためのデータ連携や、 カスタムダッシュボードのサービス 内製のデータ送信機構 & 内製 顧客向けのログ分析サービスを開発‧運⽤ プロフィットセンターとしての価値を⽰すと活動しやすくなる
  12. データ基盤⾃体の技術的負債 1 • データのワークフローや技術選定における負債  例)テーブルにパーティションやクラスターを設定しておらず、不要なコストがかかっている  例)集計結果をインサートできるテーブルを洗い替えで更新しており、コストが増え続けている  例)本来マスタで対応すべき箇所を、ハードコーディングしてDRY原則に反している データ基盤に罪はないが、データ基盤で対応が求められる負債 2 •

    当時リーズナブルな⽅針でデータ活⽤を実施したが、現在は負債に なってしまったものたち。負債と対応例は次ページ以降 • この負債への対応の仕⽅に正解はない • データ活⽤組織のつらみや嬉しみに直結しやすい • ⼀⽅、データ活⽤組織の社内のおけるプレゼンスにも影響する 03_データ活⽤推進にまつわる負債 全社的に データ活⽤を 推進するほど 貯まりやすい
  13. データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら

    ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった
  14. データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら

    ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった dbtを導⼊して 適切な層で 然るべき処理を実施
  15. データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら

    ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た
  16. データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら

    ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た カスタマーサクセス 部⾨と連携して、 指標を刷新
  17. データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら

    ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た トラッキングの基盤 をGA(UA)から内 製基盤へ BIツールのワークフ ローを刷新。 Salesforceのデータ 転送部分から⼿術 dbtを導⼊して 適切な層で 然るべき処理を実施 カスタマーサクセス 部⾨と連携して、 指標を刷新
  18. 負債がチャンスになる例 04_データ活⽤推進に起因する負債との付き合い⽅ • 経済的リソースや⼈的リソースに関 わる負債 • ワークフローの処理の複雑さに関わ る負債 • 数字の正確性や更新性、⼀覧性に関

    わる負債 負債の種類 得られるメリット • → 〜円コスト削減しました •   〜⼈⽇削減しました • → 計算速度が爆速になりました •   変更対応が⼀瞬で出来ます • → 信じられる数字をいつでも⼀箇所で •   ⾒られるようになりました
  19. 負債がチャンスになる例 04_データ活⽤推進に起因する負債との付き合い⽅ • 経済的リソースや⼈的リソースに関 わる負債 • ワークフローの処理の複雑さに関わ る負債 • 数字の正確性や更新性、⼀覧性に関

    わる負債 負債の種類 得られるメリット • → 〜円コスト削減しました •   〜⼈⽇削減しました • → 計算速度が爆速になりました •   変更対応が⼀瞬で出来ます • → 信じられる数字をいつでも⼀箇所で •   ⾒られるようになりました データエンジニア リングっていいね! という評価
  20. 集まってきた負債と付き合うコツ 04_データ活⽤推進に起因する負債との付き合い⽅ ※あくまでも個⼈の体験に基づきます。組織の状況や⼈によって、参考になる/ならないが、かなり分かれると考えます • 負債に優先順位をつける ◦ 私が優先度を⾼くする負債 ▪ ⼼が削られる負債や、時間が奪われる負債 ▪

    ビジネスインパクトが⼤きい負債 ▪ 経営陣に関わる負債 • 負債をさらに⼤きくする ◦ 可能ならばできるだけあとで解決する。時間が経った⽅が、より良いソリューションが⼿に ⼊っていたり、途中でニーズとともに負債が消滅したりするため。場合によってはリーズナブ ルな⽌⾎対応だけする • 負債をみんなで解決する⽬標として捉える ◦ データ負債は誰かを憎みがち。が、基本的には誰も悪くない。過去の⼈たちが頑張った結 果、たまたま今の状況になっているだけ。だから⼀緒に解決しましょうと持ちかける