Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ユースケースから読み解くDBやSaaSと連携したデータ分析基盤の構築方法とデータ活用の文化づく...

ユースケースから読み解くDBやSaaSと連携したデータ分析基盤の構築方法とデータ活用の文化づくり #HeatWavejp

ユースケースから読み解くDBやSaaSと連携したデータ分析基盤の構築方法とデータ活用の文化づくり
CData では400種類ものSaaSやDBのデータをDWHに連携するCData Sync を提供しており、日々お客様のデータ基盤作りやデータ活用の課題の解決を支援しています。ただ、各社毎でその取り組み方は大きく異なり、アーキテクチャやアプローチ、データ活用のための組織作りに悩む方も多いのではないでしょうか。
そこで、本セッションではCData 製品を導入した各社の事例に基づいて「各社がどのようにデータ分析基盤の構築とデータ活用の文化づくりに挑んだのか?」のエッセンスを抽出し、皆さんのデータ活用に活かしてもらえるようなポイントをまとめてお伝えしたいと思います。

【登壇者】
CData Software Japan合同会社
Lead Engineer
杉本 和也 氏

CData Software Japan

June 17, 2024
Tweet

More Decks by CData Software Japan

Other Decks in Technology

Transcript

  1. 2 About Speaker © 2024 CData Software Inc. — CONFIDENTIAL

    – DO NOT DUPLICATE OR DISTRIBUTE CData Software Japan の Lead Engineer これまで300種類以上のAPIを見たり触った りしているAPI中毒な人。 最近の趣味はTesla API で収集したデータの 可視化。 Twitter:@sugimomoto Facebook:sugimomoto Blog:https://www.cdatablog.jp/
  2. 3 © 2024 CData Software Inc. — CONFIDENTIAL – DO

    NOT DUPLICATE OR DISTRIBUTE CData Sync 3ステップ、ノーコードでデータパイプライン処理を作成、データ統合基盤を構築 SaaSやオンプレミスアプリケーション, データベース, ファイルなど400(Profile含む)を超えるデータソース 主要なデータレイク / データベース / データウェアハウス 同期先 データソース CData Sync レプリケー ション (複製)
  3. 5 このセッションを通じて皆さんに得てほしいこと © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE CData 製品を導入した各社の事例紹介を通じて 「各社はどのように各種DBやSaaS と連携したデータ分析基盤の構築とデータ活用の文化づ くりに挑んだのか?」 そこに存在した課題・背景・アプローチを理解し、皆さんにも活用してもらえるような エッセンスを持って帰ってもらいたい そして、ETLツールやデータパイプラインツールをうまく活用することで、データ分析基盤 は意外と手軽に作り始めることができるということを知ってほしい
  4. 7 背景・ビジネスモデル © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 学生が参加したイベン トや受講のデータ メールの開封/クリック 状況や、Web ページで の行動履歴 業務・売上データ WebSite・LP アクセスデータ 会社概要 社会人向け経営大学院・ビジネススクールの運営 対象部門 マーケティング部門のCRM・データ活用チーム 対象部門業務内容 デジタルデータの活用による学生のエクスペリエンス向上・新規学生の開拓 利用サービス Salesforce・Marketo・SQL Server・Google Analytics、etc…
  5. 8 課題 © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE ・各地域のキャンパスごとに データが部分最適化・サイロ化 が発生 ・それぞれで独自にダッシュ ボードやレポートを作成 ・データ分析に時間がかかり学 生とのコミュニケーション時間 の捻出に苦戦 ・データのゆらぎ、データ定義 の不一致が経営の妨げに 例えば「体験クラス・説明会の出席率レポー ト」でも、算出方法・母数の考え方が異なり、 結果の捉え方がバラバラに。
  6. 9 データ分析基盤アーキテクチャ © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE CData Sync DWH 分散されたマーケティング・学生データ・業務データをデータ分析基盤に集約 経営・各キャンパス運営に必要なデータを一箇所で確認できるようにダッシュボードを構築 見るべき数字・指標を全教員・全キャンパスで共有できる仕組みに
  7. 10 データ分析基盤構築のポイント © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 経営層からの強い コミットメント 1mm の曖昧さもない 見るべき指標の定義 データの品質担保 現場スタッフの 巻き込み 組織横断プロジェクトには、 経営層のコミットメントが必 須。 リーダーから「基本的にExcel のデータはもう見ません。今 後の数値報告はダッシュボー ドで行ってください。」とい う全組織向けのメッセージを 出し、バラバラなレポート・ ダッシュボードが発生する機 会を抑制。データ分析基盤の 活用を組織的に徹底。 「見るべき指標の鳥観図」と 「指標の定義」を作成し社内 Wiki で共有・ディスカッショ ン。どの指標が何処に紐づい ているのかを鳥観図として表 現することで、サービス改善 に向けて追うべき指標同士の つながりや全体像を明らかに。 分析の軸となるべきデータが しかるべきフィールドに入っ ているか、データの重複はな いか、データ同士がしっかり と紐付いているかなど、分析 を阻害するようなデータが生 まれないように事前対策と汚 いデータが発生した時の対処 方法を整理。 「Garbage In, Garbage Out」に ならないビジネスプロセスを 確立。 「鳥観図」、「指標の定義」、 「ダッシュボードのデザイ ン」を決める議論に、必ず現 場のスタッフにも参加。 すべての指標の定義を決めき るのに半年以上かかったが、 ユーザとなる現場スタッフが 「自分が決めた指標の定義」 だと当事者意識をもってもら いやすくなる。
  8. 11 導入効果 © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 全社向けのデータ基盤の 再構築、見るべき指標の 再定義、脱Excel により データ経営を実現。 キャンパスごとにサイロ 化されていたデータが、 全キャンパス横断で最適 化され、同じ指標・数値 を基に効率的かつ効果的 な運営が可能に。 データ連携処理・レポー ト作成の省力化により、 「人」が行うべき仕事に リソースが集中できるよ うに。
  9. 13 意思決定や判断に様々なデータへのドリルダウンが必須 © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 例えば「売上を前年よりXX%アップする」という目標の ボトルネックはどこなのか? を探索するドリルダウン
  10. 15 私達のビジネスデータはどこにある? © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE オンプレミス(ローカル)も クラウドもごちゃ混ぜ! 複数のSaaS・ソフトウェアやファイルにデータが分散している!
  11. 16 データは「分析・活用」するまでの準備作業が長い © 2024 CData Software Inc. — CONFIDENTIAL –

    DO NOT DUPLICATE OR DISTRIBUTE 「データ準備80%、データ分析20%」と言われており、 データ分析前段階作業に時間を取られている。 この部分の割合を逆転させ、分析や活用に割り当てられるようにするべき そのためにツールを有効活用しよう! データ 収集 データ 加工 データ 分析 データ 活用
  12. 17 © 2024 CData Software Inc. — CONFIDENTIAL – DO

    NOT DUPLICATE OR DISTRIBUTE CData Sync 3ステップ、ノーコードでデータパイプライン処理を作成、データ統合基盤を構築 SaaSやオンプレミスアプリケーション, データベース, ファイルなど400(Profile含む)を超えるデータソース 主要なデータレイク / データベース / データウェアハウス 同期先 データソース CData Sync レプリケー ション (複製)