モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
by
suto
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
データを「ただの資産」から 『羅針盤』 へ モダンデータスタック (MDS) の話と データ分析が起こすビジネス変⾰
Slide 2
Slide 2 text
データ分析業務プロセスについて データ分析基盤(モダンデータスタック含む)のサービス全般の概要 話すこと 話さないこと 各サービスごとの詳細な使い方
Slide 3
Slide 3 text
自己紹介 氏名 須藤 健志 (すとう たけし) 所属 クラスメソッド株式会社 データ事業本部 主な担当 データ分析基盤の構築 データマネジメントの支援 趣味 ボウリング 認定・スキル ● 2023 Japan AWS Top Engineers (Analytics) ● 2025 Japan AWS All Certifications Engineers ● 2025 Google Cloud All Certification Holders ● Tableau ○ Desktop Specialist ○ Data Analyst ↓ブログURL
Slide 4
Slide 4 text
1. なぜ今、データ基盤の話をするのか?
Slide 5
Slide 5 text
課題1: データのサイロ化 「営業データはSalesforce、 マーケはMarketo、経理は ERP…データがバラバラで繋が らない」 課題2: データの遅延と信頼性 「最新の売上レポートが⾒たい のに、出てくるのは翌⽉10⽇」 「営業部とマーケ部で『売上』 の数字が違う」 課題3: 専門家への依存 「ちょっとした分析がしたいだ けなのに、IT部⾨や分析官への 依頼が必要。すぐに対応しても らえない」 「データはあるが、使えない」という現実
Slide 6
Slide 6 text
もし、全社の信頼できる最新データが、 リアルタイムで、誰でも簡単に見られたら? もし、データが「過去の記録」ではなく 「次にとるべき行動」を教えてくれたら? → それを実現する”⼿段”が「最新データ分析基盤 (MDS)」です。 " " " "
Slide 7
Slide 7 text
2. MDS (モダンデータスタック )とは?
Slide 8
Slide 8 text
クラウドネイティブなサービスで構成されたデータ分析基盤 MDSの全体像
Slide 9
Slide 9 text
ELT (抽出→ロード→変換)による柔軟性: データを⼊れた「後」で、ビジネスニーズに合わ せて⾃由に加⼯ (T) できる。 スピードと拡張性: クラウドネイティブで処理が⾼速。容量を気にしない。 接続性: 必要なツールを「プラグイン」のように⾃由に組み合わせられる。 ✓ ✓ ✓ MDSの主な特徴
Slide 10
Slide 10 text
3. MDSアーキテクチャについて
Slide 11
Slide 11 text
誰にとっても ベストなデータ分析基盤( MDS) ってある?
Slide 12
Slide 12 text
● お客様の要件による ● 数年ごとにトレンドが変わる
Slide 13
Slide 13 text
ソリューションパターン 導入コストはトレードオフ OSSや無料ツール: インフラ構築‧管理の⼿間があり、運⽤負荷が⾼ くなる 有償のSaaS: ノーコード等で運⽤負荷が低く、機能が充実 構築のポイント : サービス選定と費用 AWS / Google Cloudネイティブ: 各サービス仕様とコード開発⾔語の学習が必要 SaaS中⼼のMDS: 機能充実でインフラ管理やコード開発を気にしな くてよいが、ライセンス料⾦など費⽤が⾼い DWHかレイクハウスか: DWH: 構造‧半構造化データのみ、SQL利⽤ レイクハウス: ML中⼼、⾮構造化含むデータの範囲 と量が⼤規模
Slide 14
Slide 14 text
Before: メッシーデータ (Messy) ‧列名が値になっている (例: 4⽉売上, 5⽉売上) ‧1セルに複数値が混在 ‧集計と⽣データが混在 After: 整然データ (Tidy) ‧1変数が1列、1観測が1⾏ ‧変数を「列」に、値を「⾏」に持つ (縦持ち) ‧DWH/BIでの分析に最適な形式 構築ポイント : 分析しやすい「整然データ」とは?
Slide 15
Slide 15 text
ブロンズ (Bronze) すべてのソースシステムから取り 込んだ⽣データの層。変更は加え ない。 シルバー (Silver) クレンジング、重複排除、SCD Type2などの履歴管理を⾏った 層。信頼できるデータソース。 ゴールド (Gold) ビジネス要件に基づき、集計やモ デリングを⾏った分析特化テーブ ルの層。BIやMLが利⽤する。 構築ポイント : テーブル設計 (メダリオンアーキテクチャ )
Slide 16
Slide 16 text
データ分析基盤( AWSネイティブなら) 代替: dbt Airflow 代替‧併⽤: Fivetran trocco Airbyte など
Slide 17
Slide 17 text
データ分析基盤( Google Cloudネイティブなら) 代替‧併⽤: Fivetran trocco Airbyte など 代替: dbt
Slide 18
Slide 18 text
モダンデータスタック( SaaS中心) 代替‧併⽤: 外部の最新モデル 代替‧併⽤: 外部の最新モデル 独⾃モデル
Slide 19
Slide 19 text
モダンデータスタック(データレイクハウス) 代替: 外部のBIツール 代替: dbt on databricks 代替‧併⽤: 外部の最新モデル
Slide 20
Slide 20 text
自分の考えるコスパ良さげな アーキテクチャは? (2025年12月)
Slide 21
Slide 21 text
構成: Snowflake中心のアーキテクチャ 代替: 外部のBIツール 代替‧併⽤: 外部の最新モデル 併⽤: Icebergテーブル 代替: FiveTran Airbyte
Slide 22
Slide 22 text
構成: Snowflake中心のアーキテクチャ この構成のメリット SQL中⼼: dbtも含め、Snowflakeのリソース作成もSQL中⼼で開発でき、学習コストが低い。 シームレスな連携: 収集(Snowpipe), DWH, ML, ⽣成AI(Cortex), カタログ(Horizon)がプラットフォーム内で完結。 DevOps: GitリポジトリとのAPI統合で、コード管理やCI/CDが容易。 ✓ ✓ ✓
Slide 23
Slide 23 text
dbt project on Snowflake(2025/11/06 GA) Snowflake上にdbt構築: dbt coreのインフラ管理が削減。ワークスペース内でdbt開発‧デプロイが可能 Snowflake上でデータパイプライン実⾏: Snowflakeタスクからdbtコマンドの実⾏ができる Git連携: Gitリポジトリとの連携設定によって、CI/CDも実現可能 ✓ ✓ ✓
Slide 24
Slide 24 text
4. 分析を「ビジネス価値」に つなげるには?
Slide 25
Slide 25 text
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析のストーリー⽴て」です。 成功のためのプロセス
Slide 26
Slide 26 text
5. MDSがビジネスを 「どう変える」か?
Slide 27
Slide 27 text
Before ‧勘と経験、そして「古い」データに基づいた⽉次の 意思決定会議。 ‧部署ごとに「売上」の定義が異なり、数字の突き合 わせに時間がかかる。 After (MDS) ‧経営層がBIツールで全社の最新KPIを「リアルタイ ム」で把握。 ‧全社共通の定義(セマンティックレイヤー)で「数 字が合わない」不⽑な議論がゼロになる。 変化1: 意思決定が「速く」「正しく」なる
Slide 28
Slide 28 text
Before ‧データが欲しい現場(営業‧マーケ)と、リソース 不⾜で対応しきれないIT部⾨との間に対⽴が⽣まれ る。 ‧簡単な集計にも数⽇間の待機が発⽣。 After (MDS) ‧IT部⾨は「信頼できるデータ基盤(ゴールド層)」 の整備に集中。 ‧現場担当者は、整備されたデータを使い、IT部⾨に 依頼せずとも⾃分で分析‧集計できる(セルフサービ ス分析)。 変化2: 現場が「自律的」になる (データの民主化 )
Slide 29
Slide 29 text
Before ‧データは「BIダッシュボードで⾒て終わり」。 ‧分析結果が現場の「次の⾏動」に繋がらず、宝の持 ち腐れになっている。 After (MDS) ‧DWHで分析した「解約しそうな優良顧客リスト」 を、⾃動でSalesforceに戻し、営業担当にアラートを 出す(リバースETL)。 ‧業務プロセス⾃体が賢くなる。 変化3: 業務が「賢く」なる (データのアクティベーション )
Slide 30
Slide 30 text
Before ‧AI/MLプロジェクトが「実験」⽌まり。 ‧AIの精度を上げるためのデータ収集やクレンジング (前処理)に⼯数の8割が割かれる。 After (MDS) ‧全社のクリーンなデータ(シルバー/ゴールド層)が Snowflakeに集約されており、AIの学習がすぐに始め られる。 ‧Snowflake Cortexで、顧客レビューの感情分析や社 内⽂書のRAG構築がSQLで実現可能に。 変化4: AIが「実用的」になる (生成AI/MLの加速)
Slide 31
Slide 31 text
6. まとめ
Slide 32
Slide 32 text
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析→アクションのためのストーリー⽴て」です。 成功のためのプロセス
Slide 33
Slide 33 text
MDSによるデータ分析がもたらすもの MDSは単なるITインフラの刷新ではありません。 それは、「ビジネスのやり⽅」そのものを変⾰す る(=トランスフォーメーション)ためのエンジ ンです。 意思決定の⾼速化、業務の⾃動化、そして「全社 的なデータ⽂化」の醸成に繋がります。 クラスメソッドは支援できます まずは「⾃部⾨の最も解決したい課題」からス モールスタートしませんか? ● 解決したい課題は何なのか定義 ● どんなデータが必要か棚卸し ● 基盤構築に加えテーブル設計もセットで MDSがもたらす未来と、次のステップ
Slide 34
Slide 34 text
ご清聴ありがとうございました