Slide 1

Slide 1 text

Yappli Tech Conference 2024.10.17 全社横断データ活⽤推進のコツと その負債とのつき合い⽅

Slide 2

Slide 2 text

Speaker 開発統括本部 プロダクト開発本部 データサイエンス室 室⻑ 阿部 昌利 ● 2020年4⽉にヤプリに⼊社 ● 社会⼈当初からデータサイエンティスト としてキャリアを積む。データ活⽤キャ リア14年⽬

Slide 3

Slide 3 text

今⽇のゴール ● みなさまが別部⾨の⽅にデータ活⽤を持ちかけたくなる ● その先のデータ活⽤の負債を引き受けたくなる

Slide 4

Slide 4 text

全社横断的なデータ活⽤の例

Slide 5

Slide 5 text

アプリログ Cloud Run, DataFlow, Pub/Sub 社員 顧客 業務の賜物 データ転送 データマート作成 社内向け / 社外向け問わず共通のデータ基盤

Slide 6

Slide 6 text

アプリログ Cloud Run, DataFlow, Pub/Sub 社員 顧客 業務の賜物 データ転送 データマート作成 分析⽤データは BigQueryに集約 社内向け / 社外向け問わず共通のデータ基盤

Slide 7

Slide 7 text

アプリログ Cloud Run, DataFlow, Pub/Sub 社員 顧客 業務の賜物 データ転送 データマート作成 データ転送 120 データマート:170 ワークフロー:55 社内向け / 社外向け問わず共通のデータ基盤

Slide 8

Slide 8 text

DS室 現在4名。2020年4⽉からの毎年の⼈数推移は、 [1名 → 1名 → 1名 → 3名 → 4名]

Slide 9

Slide 9 text

DS室

Slide 10

Slide 10 text

マーケ‧セールスKPI可視化 01_全社横断的なデータ活⽤の例 1 ● データ元:Salesforce レポート。成果物:Lookerダッシュボード ● 作成期間:1ヶ⽉。使⽤年数:2021年1⽉〜 ● ⽬的:リード獲得から商談進捗、受注、計上までを⼀気通貫で計測したい ● ポイント ○ ⾃社のSalesforceの使い⽅とデータ構造のキャッチアップ ○ ビジネスロジックはナマモノなので、変化に対応しやすいつくりにする

Slide 11

Slide 11 text

DS室

Slide 12

Slide 12 text

01_全社横断的なデータ活⽤の例 広告効果レポート⾃動化 2 ● データ元:AppsFlyer、Apple Search Ads。成果物:Googleスプレッドシート ● 作成期間:都度1~2⽇。使⽤年数:2022年12⽉〜 ● ⽬的:広告運⽤代⾏サービスのレポーティング⾃動化による⼯数削減 ● ポイント ○ データ取得上のAPI制限に引っかかりやすいので、契約や仕様を確認する ○ 売上拡⼤に貢献しやすいので、提案⽤に別途分析する

Slide 13

Slide 13 text

DS室

Slide 14

Slide 14 text

01_全社横断的なデータ活⽤の例 オフィス出社⽇数レポーティング 3 ● データ元:Googleドライブ[csvファイル]。成果物:Googleスプレッドシート ● 作成期間:5⽇。使⽤年数:2024年2⽉〜 ● ⽬的:⽉初に受領する従業員の⼊退館ログの集計⾃動化 ● ポイント ○ センシティブなデータなので権限管理を厳密にする ○ 更新が⽉初の第1営業⽇と、カレンダー上は不規則なので、⼈事担当が TROCCOを⼿動更新する形で運⽤中(ボタンを押すだけなので簡単!)

Slide 15

Slide 15 text

DS室

Slide 16

Slide 16 text

01_全社横断的なデータ活⽤の例 新プロダクトのデータ提供 4 ● データ元:MySQL。成果物:Looker Studio ● 作成期間:1ヶ⽉。使⽤年数:2023年9⽉〜 ● ⽬的:新プロダクト「Yappli CRM」のアナリティクス提供 ● ポイント ○ サービス⽤のデータベースもTROCCOで簡単に連携 ○ カスタマーサクセス担当と⼀緒に作成して、まずは社員が利⽤してブラッ シュアップ。それから顧客へ展開

Slide 17

Slide 17 text

データ活⽤推進にあたって 意識していること

Slide 18

Slide 18 text

⼩規模なデータ活⽤の基本的な流れ 02_データ活⽤推進にあたって意識していること 要件を叶えるための データを集める Point 最終的にデータ更新 する場合に、無理な く運⽤できるように ⾒据えておく データ取得 分析‧アウト プット試作 アウトプット 確定‧作成 ワーク フロー化 試作したアウトプッ トを叩き台に⽤途や 施策を議論 Point 実データを⾒ながら でないと、⼈はイ メージを持つのが難 しい ダッシュボードやア ラートシステムな ど、データ活⽤に必 要な成果物を作成す る Point アクションに直結す る最⼩限のデータに する 定期的にデータを更 新するワークフロー を作成する Point 総じて「あれもこれ も」となりやすい が、⼀番肝となる データからクイック に始める

Slide 19

Slide 19 text

⼩規模なデータ活⽤の基本的な流れ 02_データ活⽤推進にあたって意識していること 要件を叶えるための データを集める Point 最終的にデータ更新 する場合に、無理な く運⽤できるように ⾒据えておく 試作したアウトプッ トを叩き台に⽤途や 施策を議論 Point 実データを⾒ながら でないと、⼈はイ メージを持つのが難 しい ダッシュボードやア ラートシステムな ど、データ活⽤に必 要な成果物を作成す る Point アクションに直結す る最⼩限のデータに する 定期的にデータを更 新するワークフロー を作成する Point 総じて「あれもこれ も」となりやすい が、⼀番肝となる データからクイック に始める アナリティクス エンジニア リング エンジニア リング データ取得 分析‧アウト プット試作 アウトプット 確定‧作成 ワーク フロー化

Slide 20

Slide 20 text

ETLツールと分担 02_データ活⽤推進にあたって意識していること 得意 得意 得意 データ取得 分析‧アウト プット試作 アウトプット 確定‧作成 ワーク フロー化 データ元によって取 得の条件が異なり、 学習コストが高い 安定的に動き、メン テナンスしやすい仕 組みは開発コストが 高い データ活用
 メンバー
 
 
 
 ETLツール


Slide 21

Slide 21 text

データ活⽤は試⾏錯誤が重要。 コストの⾼い部分をETLツールに任せて、 データ活⽤を爆速化する 02_データ活⽤推進にあたって意識していること

Slide 22

Slide 22 text

データ 収集 ワーク フロー化 顧 客 顧 客 アウト プット 社内 ニーズ ヒアリング 相談 1. エンジニアリング ツールの⼒で⼯数を削減しやすい 3. エンジニアリング ツールの⼒で⼯数を削減しやすい 2. アナリティクス エンジニアリング部分を 省⼒化できていれば、こ のパートに注⼒してサイ クルを重ねやすい。その ためのTipsを次ページから 紹介します データ組織の⼈数‧予算拡⼤。更なるデータ活⽤ サイクルが回るに 連れて、社内の⾵向きが だんだん変わる

Slide 23

Slide 23 text

全社に対してデータを発信する 場所をつくる Tips 1 02_データ活⽤推進にあたって意識していること

Slide 24

Slide 24 text

Tips 1. データの発信場所をつくる 02_データ活⽤推進にあたって意識していること 例)Slackチャンネルでニュースを発信 例)締め会で発表枠をもらう 「あいつらにデータを渡せば何かやってくれそう」の ポジションを確⽴する

Slide 25

Slide 25 text

⾃分が意思決定者のつもりで、 成果物を作成する Tips 2 02_データ活⽤推進にあたって意識していること

Slide 26

Slide 26 text

Tips 2. 意思決定できるデータ活⽤をする 02_データ活⽤推進にあたって意識していること 基本的に、ネクストアクションとセットにして成果物を渡す。 そうすると、現場で役⽴つデータ活⽤を積み上げられる。相談が あった場合も「⾔われたまま出す」は⼤体NG。まずヒアリングする メンションする ネクストアクションの ためのリンクを貼る

Slide 27

Slide 27 text

マネタイズに結びつく データ活⽤を実現する or 計画を描く ※間接的でも成果として認められればOK Tips 3 02_データ活⽤推進にあたって意識していること

Slide 28

Slide 28 text

アプリログ Cloud Run, DataFlow, Pub/Sub 社員 顧客 業務の賜物 社内外向けのデータアウトプットにTROCCOを活⽤

Slide 29

Slide 29 text

無償 有償 CMS ダッシュボード Yappli 管理画⾯のトップに 表⽰されるダッシュボード Yappli Analytics アプリログを網羅した分析や、 機能別に特化した分析が可能な ダッシュボード。CRM版もあり Yappli Data Hub アプリ内の⾏動データや属性データを ユーザ単位で分析するためのデータ連携や、 カスタムダッシュボードのサービス 内製のデータ送信機構 & 内製 顧客向けのログ分析サービスを開発‧運⽤ プロフィットセンターとしての価値を⽰すと活動しやすくなる

Slide 30

Slide 30 text

データ活⽤推進に まつわる負債

Slide 31

Slide 31 text

データ負債は⼤きく2種類あると 考えています 03_データ活⽤推進にまつわる負債

Slide 32

Slide 32 text

データ基盤⾃体の技術的負債 1 ● データのワークフローや技術選定における負債  例)テーブルにパーティションやクラスターを設定しておらず、不要なコストがかかっている  例)集計結果をインサートできるテーブルを洗い替えで更新しており、コストが増え続けている  例)本来マスタで対応すべき箇所を、ハードコーディングしてDRY原則に反している データ基盤に罪はないが、データ基盤で対応が求められる負債 2 03_データ活⽤推進にまつわる負債 ● 当時リーズナブルな⽅針でデータ活⽤を実施したが、現在は負債に なってしまったものたち。負債と対応例は次ページ以降 ● この負債への対応の仕⽅に正解はない ● データ活⽤組織のつらみや嬉しみに直結しやすい ● ⼀⽅、データ活⽤組織の社内のおけるプレゼンスにも影響する

Slide 33

Slide 33 text

データ基盤⾃体の技術的負債 1 ● データのワークフローや技術選定における負債  例)テーブルにパーティションやクラスターを設定しておらず、不要なコストがかかっている  例)集計結果をインサートできるテーブルを洗い替えで更新しており、コストが増え続けている  例)本来マスタで対応すべき箇所を、ハードコーディングしてDRY原則に反している データ基盤に罪はないが、データ基盤で対応が求められる負債 2 ● 当時リーズナブルな⽅針でデータ活⽤を実施したが、現在は負債に なってしまったものたち。負債と対応例は次ページ以降 ● この負債への対応の仕⽅に正解はない ● データ活⽤組織のつらみや嬉しみに直結しやすい ● ⼀⽅、データ活⽤組織の社内のおけるプレゼンスにも影響する 03_データ活⽤推進にまつわる負債 全社的に データ活⽤を 推進するほど 貯まりやすい

Slide 34

Slide 34 text

データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい

Slide 35

Slide 35 text

データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい トラッキングの基盤 をGA(UA)から内 製基盤へ

Slide 36

Slide 36 text

データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった

Slide 37

Slide 37 text

データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった BIツールのワークフ ローを刷新。 Salesforceのデータ 転送部分から⼿術

Slide 38

Slide 38 text

データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった

Slide 39

Slide 39 text

データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった dbtを導⼊して 適切な層で 然るべき処理を実施

Slide 40

Slide 40 text

データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た

Slide 41

Slide 41 text

データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た カスタマーサクセス 部⾨と連携して、 指標を刷新

Slide 42

Slide 42 text

データ基盤に集まる負債例 03_データ活⽤推進にまつわる負債 <過去の意思決定に起因> お⾦で解決してデータを取 得していたが、会社の経済 状況が悪化したので、内製 にしたい <連携システムに起因> 関係システムの運⽤⽅法が データ活⽤に適しておら ず、必要なデータを得るた めに、複雑な⼯程が必要に なってしまった <会社の⼒学に起因> ビジネスメンバーの意向が 強く、拙速な拡張を繰り返 した結果、膨⼤な前処理が 必要になってしまった <期待値の乖離に起因> 本来的に⼀致し得ないデー タなのに、⼀致するものと して公開されてしまってい た トラッキングの基盤 をGA(UA)から内 製基盤へ BIツールのワークフ ローを刷新。 Salesforceのデータ 転送部分から⼿術 dbtを導⼊して 適切な層で 然るべき処理を実施 カスタマーサクセス 部⾨と連携して、 指標を刷新

Slide 43

Slide 43 text

ただこれらの負債はチャンスでもあった 03_データ活⽤推進にまつわる負債

Slide 44

Slide 44 text

データ活⽤推進に起因する 負債との付き合い⽅

Slide 45

Slide 45 text

負債がチャンスになる例 04_データ活⽤推進に起因する負債との付き合い⽅ ● 経済的リソースや⼈的リソースに関 わる負債 ● ワークフローの処理の複雑さに関わ る負債 ● 数字の正確性や更新性、⼀覧性に関 わる負債 負債の種類 得られるメリット ● → 〜円コスト削減しました ●   〜⼈⽇削減しました ● → 計算速度が爆速になりました ●   変更対応が⼀瞬で出来ます ● → 信じられる数字をいつでも⼀箇所で ●   ⾒られるようになりました

Slide 46

Slide 46 text

負債がチャンスになる例 04_データ活⽤推進に起因する負債との付き合い⽅ ● 経済的リソースや⼈的リソースに関 わる負債 ● ワークフローの処理の複雑さに関わ る負債 ● 数字の正確性や更新性、⼀覧性に関 わる負債 負債の種類 得られるメリット ● → 〜円コスト削減しました ●   〜⼈⽇削減しました ● → 計算速度が爆速になりました ●   変更対応が⼀瞬で出来ます ● → 信じられる数字をいつでも⼀箇所で ●   ⾒られるようになりました データエンジニア リングっていいね! という評価

Slide 47

Slide 47 text

基盤起因ではないのに、 データ基盤で対応が必要な負債 ニーズが実証されているデータ活⽤ 04_データ活⽤推進に起因する負債との付き合い⽅ ≒

Slide 48

Slide 48 text

負債まで育ったデータ基盤の瑕疵は 解決したもん勝ち (⽬の前の⼈からありがとうをもらえる、職務経歴書にビジネス貢献度合いを書けるようになる、 ビジネスや会社への思いやりがあるキャラになれる、偉い⼈の覚えがよくなる、などなど) 04_データ活⽤推進に起因する負債との付き合い⽅

Slide 49

Slide 49 text

集まってきた負債と付き合うコツ 04_データ活⽤推進に起因する負債との付き合い⽅ ※あくまでも個⼈の体験に基づきます。組織の状況や⼈によって、参考になる/ならないが、かなり分かれると考えます ● 負債に優先順位をつける ○ 私が優先度を⾼くする負債 ■ ⼼が削られる負債や、時間が奪われる負債 ■ ビジネスインパクトが⼤きい負債 ■ 経営陣に関わる負債 ● 負債をさらに⼤きくする ○ 可能ならばできるだけあとで解決する。時間が経った⽅が、より良いソリューションが⼿に ⼊っていたり、途中でニーズとともに負債が消滅したりするため。場合によってはリーズナブ ルな⽌⾎対応だけする ● 負債をみんなで解決する⽬標として捉える ○ データ負債は誰かを憎みがち。が、基本的には誰も悪くない。過去の⼈たちが頑張った結 果、たまたま今の状況になっているだけ。だから⼀緒に解決しましょうと持ちかける

Slide 50

Slide 50 text

負債になるまでデータ活⽤を 進めて、喜んで解決していきま しょう!