Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
suto
December 10, 2025
Technology
0
860
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
登壇資料:TohokuTech#7「あなたの会社のデータ分析、聞かせてくれませんか?」
suto
December 10, 2025
Tweet
Share
More Decks by suto
See All by suto
DevelopersIO2023「Amazon DataZoneを触ってみた」
sutotakeshi
0
1.7k
re:Growth2022「Analytics系アップデートまとめ」
sutotakeshi
0
800
OSSデータカタログツール「DataHub」を触ってみた
sutotakeshi
0
6k
Glue DataBrewでデータを クリーニング、加工してみよう
sutotakeshi
0
10k
Other Decks in Technology
See All in Technology
生成AIで速度と品質を両立する、QAエンジニア・開発者連携のAI協調型テストプロセス
shota_kusaba
0
520
スピンアウト講座02_ファイル管理
overflowinc
0
1.2k
Phase07_実務適用
overflowinc
0
1.7k
A4)シラバスを超えて語る、テストマネジメント
moritamasami
0
120
今日から始められるテスト自動化 〜 基礎知識から生成AI活用まで 〜
magicpod
1
140
Goのerror型がシンプルであることの恩恵について理解する
yamatai1212
1
300
データマネジメント戦略Night - 4社のリアルを語る会
ktatsuya
1
210
スケールアップ企業でQA組織が機能し続けるための組織設計と仕組み〜ボトムアップとトップダウンを両輪としたアプローチ〜
tarappo
4
360
20260323_データ分析基盤でGeminiを使う話
1210yuichi0
0
170
既存アプリの延命も,最新技術での新規開発も:WebSphereの最新情報
ktgrryt
0
160
大規模ECサイトのあるバッチのパフォーマンスを改善するために僕たちのチームがしてきたこと
panda_program
1
380
AgentCoreとLINEを使った飲食店おすすめアプリを作ってみた
yakumo
2
230
Featured
See All Featured
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
390
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.7k
Tell your own story through comics
letsgokoyo
1
870
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
64
52k
Site-Speed That Sticks
csswizardry
13
1.1k
The Limits of Empathy - UXLibs8
cassininazir
1
270
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
130
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Transcript
データを「ただの資産」から 『羅針盤』 へ モダンデータスタック (MDS) の話と データ分析が起こすビジネス変⾰
データ分析業務プロセスについて データ分析基盤(モダンデータスタック含む)のサービス全般の概要 話すこと 話さないこと 各サービスごとの詳細な使い方
自己紹介 氏名 須藤 健志 (すとう たけし) 所属 クラスメソッド株式会社 データ事業本部 主な担当 データ分析基盤の構築 データマネジメントの支援
趣味 ボウリング 認定・スキル • 2023 Japan AWS Top Engineers (Analytics) • 2025 Japan AWS All Certifications Engineers • 2025 Google Cloud All Certification Holders • Tableau ◦ Desktop Specialist ◦ Data Analyst ↓ブログURL
1. なぜ今、データ基盤の話をするのか?
課題1: データのサイロ化 「営業データはSalesforce、 マーケはMarketo、経理は ERP…データがバラバラで繋が らない」 課題2: データの遅延と信頼性 「最新の売上レポートが⾒たい のに、出てくるのは翌⽉10⽇」
「営業部とマーケ部で『売上』 の数字が違う」 課題3: 専門家への依存 「ちょっとした分析がしたいだ けなのに、IT部⾨や分析官への 依頼が必要。すぐに対応しても らえない」 「データはあるが、使えない」という現実
もし、全社の信頼できる最新データが、 リアルタイムで、誰でも簡単に見られたら? もし、データが「過去の記録」ではなく 「次にとるべき行動」を教えてくれたら? → それを実現する”⼿段”が「最新データ分析基盤 (MDS)」です。 " " "
"
2. MDS (モダンデータスタック )とは?
クラウドネイティブなサービスで構成されたデータ分析基盤 MDSの全体像
ELT (抽出→ロード→変換)による柔軟性: データを⼊れた「後」で、ビジネスニーズに合わ せて⾃由に加⼯ (T) できる。 スピードと拡張性: クラウドネイティブで処理が⾼速。容量を気にしない。 接続性: 必要なツールを「プラグイン」のように⾃由に組み合わせられる。
✓ ✓ ✓ MDSの主な特徴
3. MDSアーキテクチャについて
誰にとっても ベストなデータ分析基盤( MDS) ってある?
• お客様の要件による • 数年ごとにトレンドが変わる
ソリューションパターン 導入コストはトレードオフ OSSや無料ツール: インフラ構築‧管理の⼿間があり、運⽤負荷が⾼ くなる 有償のSaaS: ノーコード等で運⽤負荷が低く、機能が充実 構築のポイント : サービス選定と費用
AWS / Google Cloudネイティブ: 各サービス仕様とコード開発⾔語の学習が必要 SaaS中⼼のMDS: 機能充実でインフラ管理やコード開発を気にしな くてよいが、ライセンス料⾦など費⽤が⾼い DWHかレイクハウスか: DWH: 構造‧半構造化データのみ、SQL利⽤ レイクハウス: ML中⼼、⾮構造化含むデータの範囲 と量が⼤規模
Before: メッシーデータ (Messy) ‧列名が値になっている (例: 4⽉売上, 5⽉売上) ‧1セルに複数値が混在 ‧集計と⽣データが混在 After:
整然データ (Tidy) ‧1変数が1列、1観測が1⾏ ‧変数を「列」に、値を「⾏」に持つ (縦持ち) ‧DWH/BIでの分析に最適な形式 構築ポイント : 分析しやすい「整然データ」とは?
ブロンズ (Bronze) すべてのソースシステムから取り 込んだ⽣データの層。変更は加え ない。 シルバー (Silver) クレンジング、重複排除、SCD Type2などの履歴管理を⾏った 層。信頼できるデータソース。
ゴールド (Gold) ビジネス要件に基づき、集計やモ デリングを⾏った分析特化テーブ ルの層。BIやMLが利⽤する。 構築ポイント : テーブル設計 (メダリオンアーキテクチャ )
データ分析基盤( AWSネイティブなら) 代替: dbt Airflow 代替‧併⽤: Fivetran trocco Airbyte など
データ分析基盤( Google Cloudネイティブなら) 代替‧併⽤: Fivetran trocco Airbyte など 代替: dbt
モダンデータスタック( SaaS中心) 代替‧併⽤: 外部の最新モデル 代替‧併⽤: 外部の最新モデル 独⾃モデル
モダンデータスタック(データレイクハウス) 代替: 外部のBIツール 代替: dbt on databricks 代替‧併⽤: 外部の最新モデル
自分の考えるコスパ良さげな アーキテクチャは? (2025年12月)
構成: Snowflake中心のアーキテクチャ 代替: 外部のBIツール 代替‧併⽤: 外部の最新モデル 併⽤: Icebergテーブル 代替: FiveTran
Airbyte
構成: Snowflake中心のアーキテクチャ この構成のメリット SQL中⼼: dbtも含め、Snowflakeのリソース作成もSQL中⼼で開発でき、学習コストが低い。 シームレスな連携: 収集(Snowpipe), DWH, ML, ⽣成AI(Cortex),
カタログ(Horizon)がプラットフォーム内で完結。 DevOps: GitリポジトリとのAPI統合で、コード管理やCI/CDが容易。 ✓ ✓ ✓
dbt project on Snowflake(2025/11/06 GA) Snowflake上にdbt構築: dbt coreのインフラ管理が削減。ワークスペース内でdbt開発‧デプロイが可能 Snowflake上でデータパイプライン実⾏: Snowflakeタスクからdbtコマンドの実⾏ができる
Git連携: Gitリポジトリとの連携設定によって、CI/CDも実現可能 ✓ ✓ ✓
4. 分析を「ビジネス価値」に つなげるには?
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック
BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析のストーリー⽴て」です。 成功のためのプロセス
5. MDSがビジネスを 「どう変える」か?
Before ‧勘と経験、そして「古い」データに基づいた⽉次の 意思決定会議。 ‧部署ごとに「売上」の定義が異なり、数字の突き合 わせに時間がかかる。 After (MDS) ‧経営層がBIツールで全社の最新KPIを「リアルタイ ム」で把握。 ‧全社共通の定義(セマンティックレイヤー)で「数
字が合わない」不⽑な議論がゼロになる。 変化1: 意思決定が「速く」「正しく」なる
Before ‧データが欲しい現場(営業‧マーケ)と、リソース 不⾜で対応しきれないIT部⾨との間に対⽴が⽣まれ る。 ‧簡単な集計にも数⽇間の待機が発⽣。 After (MDS) ‧IT部⾨は「信頼できるデータ基盤(ゴールド層)」 の整備に集中。 ‧現場担当者は、整備されたデータを使い、IT部⾨に
依頼せずとも⾃分で分析‧集計できる(セルフサービ ス分析)。 変化2: 現場が「自律的」になる (データの民主化 )
Before ‧データは「BIダッシュボードで⾒て終わり」。 ‧分析結果が現場の「次の⾏動」に繋がらず、宝の持 ち腐れになっている。 After (MDS) ‧DWHで分析した「解約しそうな優良顧客リスト」 を、⾃動でSalesforceに戻し、営業担当にアラートを 出す(リバースETL)。 ‧業務プロセス⾃体が賢くなる。
変化3: 業務が「賢く」なる (データのアクティベーション )
Before ‧AI/MLプロジェクトが「実験」⽌まり。 ‧AIの精度を上げるためのデータ収集やクレンジング (前処理)に⼯数の8割が割かれる。 After (MDS) ‧全社のクリーンなデータ(シルバー/ゴールド層)が Snowflakeに集約されており、AIの学習がすぐに始め られる。 ‧Snowflake
Cortexで、顧客レビューの感情分析や社 内⽂書のRAG構築がSQLで実現可能に。 変化4: AIが「実用的」になる (生成AI/MLの加速)
6. まとめ
ビジネス課題の洗い出し 何を解決したいのかを明確にする。 分析のためのストーリー⽴て 課題解決のために、どのデータをどう分析‧可視化するかの仮説を⽴てる。 必要なデータソースのリスト化 仮説検証に必要なデータがどこにあるか、⾜りているかを確認する。 「整備されたデータ」の作成 (MDSの運⽤) 分析しやすいゴールドテーブルを設計し、運⽤する。 分析の実⾏とフィードバック
BIやMLで分析し、ビジネス上の⽰唆を得る。 「BIダッシュボードを作ること」をゴールにしてはいけない。 最も重要なのは「課題設定」と「分析→アクションのためのストーリー⽴て」です。 成功のためのプロセス
MDSによるデータ分析がもたらすもの MDSは単なるITインフラの刷新ではありません。 それは、「ビジネスのやり⽅」そのものを変⾰す る(=トランスフォーメーション)ためのエンジ ンです。 意思決定の⾼速化、業務の⾃動化、そして「全社 的なデータ⽂化」の醸成に繋がります。 クラスメソッドは支援できます まずは「⾃部⾨の最も解決したい課題」からス モールスタートしませんか?
• 解決したい課題は何なのか定義 • どんなデータが必要か棚卸し • 基盤構築に加えテーブル設計もセットで MDSがもたらす未来と、次のステップ
ご清聴ありがとうございました