Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
Search
suto
December 10, 2025
Technology
0
590
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
登壇資料:TohokuTech#7「あなたの会社のデータ分析、聞かせてくれませんか?」
suto
December 10, 2025
Tweet
Share
More Decks by suto
See All by suto
DevelopersIO2023「Amazon DataZoneを触ってみた」
sutotakeshi
0
1.7k
re:Growth2022「Analytics系アップデートまとめ」
sutotakeshi
0
790
OSSデータカタログツール「DataHub」を触ってみた
sutotakeshi
0
5.9k
Glue DataBrewでデータを クリーニング、加工してみよう
sutotakeshi
0
8k
Other Decks in Technology
See All in Technology
複雑さを受け入れるか、拒むか? - 事業成長とともに育ったモノリスを前に私が考えたこと #RSGT2026
murabayashi
1
1.8k
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1k
2025年の医用画像AI/AI×medical_imaging_in_2025_generated_by_AI
tdys13
0
330
形式手法特論:コンパイラの「正しさ」は証明できるか? #burikaigi / BuriKaigi 2026
ytaka23
16
5k
ECS_EKS以外の選択肢_ROSA入門_.pdf
masakiokuda
1
130
【Agentforce Hackathon Tokyo 2025 発表資料】みらいシフト:あなた働き方を、みらいへシフト。
kuratani
0
110
Databricks Free Edition講座 データエンジニアリング編
taka_aki
0
2.5k
Oracle Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
1
910
re:Invent2025 セッションレポ ~Spec-driven development with Kiro~
nrinetcom
PRO
2
170
AIと融ける人間の冒険
pujisi
0
120
業務の煩悩を祓うAI活用術108選 / AI 108 Usages
smartbank
9
21k
スクラムマスターが スクラムチームに入って取り組む5つのこと - スクラムガイドには書いてないけど入った当初から取り組んでおきたい大切なこと -
scrummasudar
3
2k
Featured
See All Featured
Game over? The fight for quality and originality in the time of robots
wayneb77
1
77
Between Models and Reality
mayunak
1
160
How to Ace a Technical Interview
jacobian
281
24k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
2.8k
What does AI have to do with Human Rights?
axbom
PRO
0
1.9k
Claude Code のすすめ
schroneko
67
210k
Mind Mapping
helmedeiros
PRO
0
47
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
61
51k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
46
Exploring anti-patterns in Rails
aemeredith
2
220
Agile that works and the tools we love
rasmusluckow
331
21k
Optimizing for Happiness
mojombo
379
70k
Transcript
データを「ただの資産」から 『羅針盤』 へ モダンデータスタック (MDS) の話と データ分析が起こすビジネス変⾰
データ分析業務プロセスについて データ分析基盤(モダンデータスタック含む)のサービス全般の概要 話すこと 話さないこと 各サービスごとの詳細な使い方
自己紹介 氏名 須藤 健志 (すとう たけし) 所属 クラスメソッド株式会社 データ事業本部 主な担当 データ分析基盤の構築 データマネジメントの支援
趣味 ボウリング 認定・スキル • 2023 Japan AWS Top Engineers (Analytics) • 2025 Japan AWS All Certifications Engineers • 2025 Google Cloud All Certification Holders • Tableau ◦ Desktop Specialist ◦ Data Analyst ↓ブログURL
1. なぜ今、データ基盤の話をするのか?
課題1: データのサイロ化 「営業データはSalesforce、 マーケはMarketo、経理は ERP…データがバラバラで繋が らない」 課題2: データの遅延と信頼性 「最新の売上レポートが⾒たい のに、出てくるのは翌⽉10⽇」
「営業部とマーケ部で『売上』 の数字が違う」 課題3: 専門家への依存 「ちょっとした分析がしたいだ けなのに、IT部⾨や分析官への 依頼が必要。すぐに対応しても らえない」 「データはあるが、使えない」という現実
もし、全社の信頼できる最新データが、 リアルタイムで、誰でも簡単に見られたら? もし、データが「過去の記録」ではなく 「次にとるべき行動」を教えてくれたら? → それを実現する”⼿段”が「最新データ分析基盤 (MDS)」です。 " " "
"
2. MDS (モダンデータスタック )とは?
クラウドネイティブなサービスで構成されたデータ分析基盤 MDSの全体像
ELT (抽出→ロード→変換)による柔軟性: データを⼊れた「後」で、ビジネスニーズに合わ せて⾃由に加⼯ (T) できる。 スピードと拡張性: クラウドネイティブで処理が⾼速。容量を気にしない。 接続性: 必要なツールを「プラグイン」のように⾃由に組み合わせられる。
✓ ✓ ✓ MDSの主な特徴
3. MDSアーキテクチャについて
誰にとっても ベストなデータ分析基盤( MDS) ってある?
• お客様の要件による • 数年ごとにトレンドが変わる
ソリューションパターン 導入コストはトレードオフ OSSや無料ツール: インフラ構築‧管理の⼿間があり、運⽤負荷が⾼ くなる 有償のSaaS: ノーコード等で運⽤負荷が低く、機能が充実 構築のポイント : サービス選定と費用
AWS / Google Cloudネイティブ: 各サービス仕様とコード開発⾔語の学習が必要 SaaS中⼼のMDS: 機能充実でインフラ管理やコード開発を気にしな くてよいが、ライセンス料⾦など費⽤が⾼い DWHかレイクハウスか: DWH: 構造‧半構造化データのみ、SQL利⽤ レイクハウス: ML中⼼、⾮構造化含むデータの範囲 と量が⼤規模
Before: メッシーデータ (Messy) ‧列名が値になっている (例: 4⽉売上, 5⽉売上) ‧1セルに複数値が混在 ‧集計と⽣データが混在 After:
整然データ (Tidy) ‧1変数が1列、1観測が1⾏ ‧変数を「列」に、値を「⾏」に持つ (縦持ち) ‧DWH/BIでの分析に最適な形式 構築ポイント : 分析しやすい「整然データ」とは?
ブロンズ (Bronze) すべてのソースシステムから取り 込んだ⽣データの層。変更は加え ない。 シルバー (Silver) クレンジング、重複排除、SCD Type2などの履歴管理を⾏った 層。信頼できるデータソース。
ゴールド (Gold) ビジネス要件に基づき、集計やモ デリングを⾏った分析特化テーブ ルの層。BIやMLが利⽤する。 構築ポイント : テーブル設計 (メダリオンアーキテクチャ )
データ分析基盤( AWSネイティブなら) 代替: dbt Airflow 代替‧併⽤: Fivetran trocco Airbyte など
データ分析基盤( Google Cloudネイティブなら) 代替‧併⽤: Fivetran trocco Airbyte など 代替: dbt
モダンデータスタック( SaaS中心) 代替‧併⽤: 外部の最新モデル 代替‧併⽤: 外部の最新モデル 独⾃モデル
モダンデータスタック(データレイクハウス) 代替: 外部のBIツール 代替: dbt on databricks 代替‧併⽤: 外部の最新モデル
自分の考えるコスパ良さげな アーキテクチャは? (2025年12月)
構成: Snowflake中心のアーキテクチャ 代替: 外部のBIツール 代替‧併⽤: 外部の最新モデル 併⽤: Icebergテーブル 代替: FiveTran
Airbyte
構成: Snowflake中心のアーキテクチャ この構成のメリット SQL中⼼: dbtも含め、Snowflakeのリソース作成もSQL中⼼で開発でき、学習コストが低い。 シームレスな連携: 収集(Snowpipe), DWH, ML, ⽣成AI(Cortex),
カタログ(Horizon)がプラットフォーム内で完結。 DevOps: GitリポジトリとのAPI統合で、コード管理やCI/CDが容易。 ✓ ✓ ✓
dbt project on Snowflake(2025/11/06 GA) Snowflake上にdbt構築: dbt coreのインフラ管理が削減。ワークスペース内でdbt開発‧デプロイが可能 Snowflake上でデータパイプライン実⾏: Snowflakeタスクからdbtコマンドの実⾏ができる
Git連携: Gitリポジトリとの連携設定によって、CI/CDも実現可能 ✓ ✓ ✓
4. 分析を「ビジネス価値」に つなげるには?
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック
BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析のストーリー⽴て」です。 成功のためのプロセス
5. MDSがビジネスを 「どう変える」か?
Before ‧勘と経験、そして「古い」データに基づいた⽉次の 意思決定会議。 ‧部署ごとに「売上」の定義が異なり、数字の突き合 わせに時間がかかる。 After (MDS) ‧経営層がBIツールで全社の最新KPIを「リアルタイ ム」で把握。 ‧全社共通の定義(セマンティックレイヤー)で「数
字が合わない」不⽑な議論がゼロになる。 変化1: 意思決定が「速く」「正しく」なる
Before ‧データが欲しい現場(営業‧マーケ)と、リソース 不⾜で対応しきれないIT部⾨との間に対⽴が⽣まれ る。 ‧簡単な集計にも数⽇間の待機が発⽣。 After (MDS) ‧IT部⾨は「信頼できるデータ基盤(ゴールド層)」 の整備に集中。 ‧現場担当者は、整備されたデータを使い、IT部⾨に
依頼せずとも⾃分で分析‧集計できる(セルフサービ ス分析)。 変化2: 現場が「自律的」になる (データの民主化 )
Before ‧データは「BIダッシュボードで⾒て終わり」。 ‧分析結果が現場の「次の⾏動」に繋がらず、宝の持 ち腐れになっている。 After (MDS) ‧DWHで分析した「解約しそうな優良顧客リスト」 を、⾃動でSalesforceに戻し、営業担当にアラートを 出す(リバースETL)。 ‧業務プロセス⾃体が賢くなる。
変化3: 業務が「賢く」なる (データのアクティベーション )
Before ‧AI/MLプロジェクトが「実験」⽌まり。 ‧AIの精度を上げるためのデータ収集やクレンジング (前処理)に⼯数の8割が割かれる。 After (MDS) ‧全社のクリーンなデータ(シルバー/ゴールド層)が Snowflakeに集約されており、AIの学習がすぐに始め られる。 ‧Snowflake
Cortexで、顧客レビューの感情分析や社 内⽂書のRAG構築がSQLで実現可能に。 変化4: AIが「実用的」になる (生成AI/MLの加速)
6. まとめ
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック
BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析→アクションのためのストーリー⽴て」です。 成功のためのプロセス
MDSによるデータ分析がもたらすもの MDSは単なるITインフラの刷新ではありません。 それは、「ビジネスのやり⽅」そのものを変⾰す る(=トランスフォーメーション)ためのエンジ ンです。 意思決定の⾼速化、業務の⾃動化、そして「全社 的なデータ⽂化」の醸成に繋がります。 クラスメソッドは支援できます まずは「⾃部⾨の最も解決したい課題」からス モールスタートしませんか?
• 解決したい課題は何なのか定義 • どんなデータが必要か棚卸し • 基盤構築に加えテーブル設計もセットで MDSがもたらす未来と、次のステップ
ご清聴ありがとうございました