Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
suto
December 10, 2025
Technology
0
640
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
登壇資料:TohokuTech#7「あなたの会社のデータ分析、聞かせてくれませんか?」
suto
December 10, 2025
Tweet
Share
More Decks by suto
See All by suto
DevelopersIO2023「Amazon DataZoneを触ってみた」
sutotakeshi
0
1.7k
re:Growth2022「Analytics系アップデートまとめ」
sutotakeshi
0
790
OSSデータカタログツール「DataHub」を触ってみた
sutotakeshi
0
5.9k
Glue DataBrewでデータを クリーニング、加工してみよう
sutotakeshi
0
8.5k
Other Decks in Technology
See All in Technology
しろおびセキュリティへ ようこそ
log0417
0
210
2026年はチャンキングを極める!
shibuiwilliam
8
1.7k
Amazon Bedrock AgentCore 認証・認可入門
hironobuiga
2
460
AI開発の落とし穴 〜馬には乗ってみよAIには添うてみよ〜
sansantech
PRO
10
5.6k
エンジニアとマネジメントの距離/Engineering and Management
ikuodanaka
3
690
Deno・Bunの標準機能やElysiaJSを使ったWebSocketサーバー実装 / ラーメン屋を貸し切ってLT会! IoTLT 2026新年会
you
PRO
0
180
Introduction to Bill One Development Engineer
sansan33
PRO
0
350
SREの仕事を自動化する際にやっておきたい5つのポイント
jacopen
6
1.2k
システムのアラート調査をサポートするAI Agentの紹介/Introduction to an AI Agent for System Alert Investigation
taddy_919
2
1.1k
DatabricksホストモデルでAIコーディング環境を構築する
databricksjapan
0
210
日本語テキストと音楽の対照学習の技術とその応用
lycorptech_jp
PRO
1
380
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
2.9k
Featured
See All Featured
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
100
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
390
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
160
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
340
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Faster Mobile Websites
deanohume
310
31k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
54
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
230
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
190
Side Projects
sachag
455
43k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
3.9k
Statistics for Hackers
jakevdp
799
230k
Transcript
データを「ただの資産」から 『羅針盤』 へ モダンデータスタック (MDS) の話と データ分析が起こすビジネス変⾰
データ分析業務プロセスについて データ分析基盤(モダンデータスタック含む)のサービス全般の概要 話すこと 話さないこと 各サービスごとの詳細な使い方
自己紹介 氏名 須藤 健志 (すとう たけし) 所属 クラスメソッド株式会社 データ事業本部 主な担当 データ分析基盤の構築 データマネジメントの支援
趣味 ボウリング 認定・スキル • 2023 Japan AWS Top Engineers (Analytics) • 2025 Japan AWS All Certifications Engineers • 2025 Google Cloud All Certification Holders • Tableau ◦ Desktop Specialist ◦ Data Analyst ↓ブログURL
1. なぜ今、データ基盤の話をするのか?
課題1: データのサイロ化 「営業データはSalesforce、 マーケはMarketo、経理は ERP…データがバラバラで繋が らない」 課題2: データの遅延と信頼性 「最新の売上レポートが⾒たい のに、出てくるのは翌⽉10⽇」
「営業部とマーケ部で『売上』 の数字が違う」 課題3: 専門家への依存 「ちょっとした分析がしたいだ けなのに、IT部⾨や分析官への 依頼が必要。すぐに対応しても らえない」 「データはあるが、使えない」という現実
もし、全社の信頼できる最新データが、 リアルタイムで、誰でも簡単に見られたら? もし、データが「過去の記録」ではなく 「次にとるべき行動」を教えてくれたら? → それを実現する”⼿段”が「最新データ分析基盤 (MDS)」です。 " " "
"
2. MDS (モダンデータスタック )とは?
クラウドネイティブなサービスで構成されたデータ分析基盤 MDSの全体像
ELT (抽出→ロード→変換)による柔軟性: データを⼊れた「後」で、ビジネスニーズに合わ せて⾃由に加⼯ (T) できる。 スピードと拡張性: クラウドネイティブで処理が⾼速。容量を気にしない。 接続性: 必要なツールを「プラグイン」のように⾃由に組み合わせられる。
✓ ✓ ✓ MDSの主な特徴
3. MDSアーキテクチャについて
誰にとっても ベストなデータ分析基盤( MDS) ってある?
• お客様の要件による • 数年ごとにトレンドが変わる
ソリューションパターン 導入コストはトレードオフ OSSや無料ツール: インフラ構築‧管理の⼿間があり、運⽤負荷が⾼ くなる 有償のSaaS: ノーコード等で運⽤負荷が低く、機能が充実 構築のポイント : サービス選定と費用
AWS / Google Cloudネイティブ: 各サービス仕様とコード開発⾔語の学習が必要 SaaS中⼼のMDS: 機能充実でインフラ管理やコード開発を気にしな くてよいが、ライセンス料⾦など費⽤が⾼い DWHかレイクハウスか: DWH: 構造‧半構造化データのみ、SQL利⽤ レイクハウス: ML中⼼、⾮構造化含むデータの範囲 と量が⼤規模
Before: メッシーデータ (Messy) ‧列名が値になっている (例: 4⽉売上, 5⽉売上) ‧1セルに複数値が混在 ‧集計と⽣データが混在 After:
整然データ (Tidy) ‧1変数が1列、1観測が1⾏ ‧変数を「列」に、値を「⾏」に持つ (縦持ち) ‧DWH/BIでの分析に最適な形式 構築ポイント : 分析しやすい「整然データ」とは?
ブロンズ (Bronze) すべてのソースシステムから取り 込んだ⽣データの層。変更は加え ない。 シルバー (Silver) クレンジング、重複排除、SCD Type2などの履歴管理を⾏った 層。信頼できるデータソース。
ゴールド (Gold) ビジネス要件に基づき、集計やモ デリングを⾏った分析特化テーブ ルの層。BIやMLが利⽤する。 構築ポイント : テーブル設計 (メダリオンアーキテクチャ )
データ分析基盤( AWSネイティブなら) 代替: dbt Airflow 代替‧併⽤: Fivetran trocco Airbyte など
データ分析基盤( Google Cloudネイティブなら) 代替‧併⽤: Fivetran trocco Airbyte など 代替: dbt
モダンデータスタック( SaaS中心) 代替‧併⽤: 外部の最新モデル 代替‧併⽤: 外部の最新モデル 独⾃モデル
モダンデータスタック(データレイクハウス) 代替: 外部のBIツール 代替: dbt on databricks 代替‧併⽤: 外部の最新モデル
自分の考えるコスパ良さげな アーキテクチャは? (2025年12月)
構成: Snowflake中心のアーキテクチャ 代替: 外部のBIツール 代替‧併⽤: 外部の最新モデル 併⽤: Icebergテーブル 代替: FiveTran
Airbyte
構成: Snowflake中心のアーキテクチャ この構成のメリット SQL中⼼: dbtも含め、Snowflakeのリソース作成もSQL中⼼で開発でき、学習コストが低い。 シームレスな連携: 収集(Snowpipe), DWH, ML, ⽣成AI(Cortex),
カタログ(Horizon)がプラットフォーム内で完結。 DevOps: GitリポジトリとのAPI統合で、コード管理やCI/CDが容易。 ✓ ✓ ✓
dbt project on Snowflake(2025/11/06 GA) Snowflake上にdbt構築: dbt coreのインフラ管理が削減。ワークスペース内でdbt開発‧デプロイが可能 Snowflake上でデータパイプライン実⾏: Snowflakeタスクからdbtコマンドの実⾏ができる
Git連携: Gitリポジトリとの連携設定によって、CI/CDも実現可能 ✓ ✓ ✓
4. 分析を「ビジネス価値」に つなげるには?
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック
BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析のストーリー⽴て」です。 成功のためのプロセス
5. MDSがビジネスを 「どう変える」か?
Before ‧勘と経験、そして「古い」データに基づいた⽉次の 意思決定会議。 ‧部署ごとに「売上」の定義が異なり、数字の突き合 わせに時間がかかる。 After (MDS) ‧経営層がBIツールで全社の最新KPIを「リアルタイ ム」で把握。 ‧全社共通の定義(セマンティックレイヤー)で「数
字が合わない」不⽑な議論がゼロになる。 変化1: 意思決定が「速く」「正しく」なる
Before ‧データが欲しい現場(営業‧マーケ)と、リソース 不⾜で対応しきれないIT部⾨との間に対⽴が⽣まれ る。 ‧簡単な集計にも数⽇間の待機が発⽣。 After (MDS) ‧IT部⾨は「信頼できるデータ基盤(ゴールド層)」 の整備に集中。 ‧現場担当者は、整備されたデータを使い、IT部⾨に
依頼せずとも⾃分で分析‧集計できる(セルフサービ ス分析)。 変化2: 現場が「自律的」になる (データの民主化 )
Before ‧データは「BIダッシュボードで⾒て終わり」。 ‧分析結果が現場の「次の⾏動」に繋がらず、宝の持 ち腐れになっている。 After (MDS) ‧DWHで分析した「解約しそうな優良顧客リスト」 を、⾃動でSalesforceに戻し、営業担当にアラートを 出す(リバースETL)。 ‧業務プロセス⾃体が賢くなる。
変化3: 業務が「賢く」なる (データのアクティベーション )
Before ‧AI/MLプロジェクトが「実験」⽌まり。 ‧AIの精度を上げるためのデータ収集やクレンジング (前処理)に⼯数の8割が割かれる。 After (MDS) ‧全社のクリーンなデータ(シルバー/ゴールド層)が Snowflakeに集約されており、AIの学習がすぐに始め られる。 ‧Snowflake
Cortexで、顧客レビューの感情分析や社 内⽂書のRAG構築がSQLで実現可能に。 変化4: AIが「実用的」になる (生成AI/MLの加速)
6. まとめ
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック
BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析→アクションのためのストーリー⽴て」です。 成功のためのプロセス
MDSによるデータ分析がもたらすもの MDSは単なるITインフラの刷新ではありません。 それは、「ビジネスのやり⽅」そのものを変⾰す る(=トランスフォーメーション)ためのエンジ ンです。 意思決定の⾼速化、業務の⾃動化、そして「全社 的なデータ⽂化」の醸成に繋がります。 クラスメソッドは支援できます まずは「⾃部⾨の最も解決したい課題」からス モールスタートしませんか?
• 解決したい課題は何なのか定義 • どんなデータが必要か棚卸し • 基盤構築に加えテーブル設計もセットで MDSがもたらす未来と、次のステップ
ご清聴ありがとうございました