Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Microsoft Fabric におけるデータ統合を考える
Search
Ryoma Nagata
July 22, 2023
Technology
1.2k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Microsoft Fabric におけるデータ統合を考える
https://sqlserver.connpass.com/event/285453/ 資料
Ryoma Nagata
July 22, 2023
More Decks by Ryoma Nagata
See All by Ryoma Nagata
Fabric-cicd によるAzure DevOps デプロイ
ryomaru0825
0
190
Fabric MCPの紹介と使い分け
ryomaru0825
1
270
Microsoft Fabricで考える非構造データのAI活用
ryomaru0825
0
1.2k
Microsoft Fabric のワークスペースと容量の設計原則
ryomaru0825
2
650
Microsoft Fabric AI Demo @Tech Boost Summit 2025
ryomaru0825
1
440
忙しい人むけの FabCon Vienna 2025 KeyNote
ryomaru0825
1
220
Microsoft Fabric 攻略ガイド 2.0 (ドラフト)
ryomaru0825
2
2.3k
Microsoft Fabric のネットワーク保護のアップデートについて
ryomaru0825
2
550
Microsoft Analytics Day 2025.7 最新情報ピックアップ・デモ
ryomaru0825
1
130
Other Decks in Technology
See All in Technology
価格.comをAI駆動で全面刷新する ー 30年分の技術的負債を返し、次の30年の土台をつくる ー / AI Engineering Summit Tokyo 2026
tkyowa
50
55k
Dynamic Workersについて
yusukebe
2
620
Diagnosing performance problems without the guesswork
elenatanasoiu
0
170
速さだけじゃない! VoidZero ツールが移行先に選ばれる理由
mizdra
PRO
6
760
AgentGatewayを試してみたかった
tkikuchi
0
120
Agentic Web
dynamis
1
160
Ruby::Boxでできること、Refinementsでできること
joker1007
3
400
AIにフローを作らせようとして挫折した話
hamatsutaichi
0
220
noUncheckedIndexedAccess、3時間、1万円。 / noUncheckedIndexedAccess, 3 Hours, 10,000 JPY.
kaonavi
1
320
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
200
ChatworkとBPaaS 異なる特性で学んだAI機能開発の ベストプラクティス
kubell_hr
2
3k
実装は速くなった、レビューはどうする? ― 自身のレビューをAIで再現させるサーヴァントエンジニアリングのすゝめ / Implementation got faster. So what about reviews? — An invitation to Servant Engineering: Recreating your own code reviews with AI
nrslib
7
4.1k
Featured
See All Featured
KATA
mclloyd
PRO
35
15k
Technical Leadership for Architectural Decision Making
baasie
3
400
Designing for Performance
lara
611
70k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
Balancing Empowerment & Direction
lara
6
1.1k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.6k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
62
44k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
170
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
The untapped power of vector embeddings
frankvandijk
2
1.7k
Claude Code のすすめ
schroneko
67
230k
Typedesign – Prime Four
hannesfritz
42
3.1k
Transcript
Microsoft Fabric のデータ統合機能について Microsoft MVP for Data Platform 永田 亮磨
Twitter: @ryomaru0825 Linkedin: ryoma-nagata-0825 Qiita: ryoma-nagata
自己紹介 永田 亮磨(Ryoma Nagata) • Microsoft MVP for Data Platform
• Databricks Solutions Architect Champion • 株式会社ジール • Microsoft Data Analytics Solution の導入など • 主な活動場所 • Qiita : @ryoma-nagata • Twitter : @ryomaru0825 • connpass : • JSSUG (Japan SQL Server User Group) • JEDAI - The Data & AI Meetup MVP Profile 推しサービス Synapse / Power BI / Databricks / Purview Fabric (New!)
• データ統合について • Microsoft Fabric のデータ統合 • デモ • オンプレミスデータゲートウェイとデータフローによる
SQL Server データの物理統合 • OneLake による仮想統合 with Azure Databricks Agenda
データ統合と相互運用性 データ統合と相互運用性の目標 1. 人とシステムそれぞれが必要とするフォーマットと時間枠でデータを提供できるようにする 2. データを物理的および仮想的にデータハブに集約する 3. モデルとインターフェースを開発し共有することでソリューションを管理するコストと複雑さを 削減する 4.
重要なイベント(機械と脅威)を特定し、アラートとアクションを起動する 5. ビジネスインテリジェンス、アナリティクス、マスターデータ管理、業務効率化の取り組みを サポートする DAMA International.『データマネジメント知識体系ガイド 第二版』.日経BP社.2018年,96p
• 中心となる技術は ETL(抽出、変換、取り込み): • データは物理的であれ仮想的であれETLプロセスにより、利用可能となる • 抽出: • 必要なデータをソースデータストアから抽出し、ディスクやメモリにステージングされる •
変換: • フォーマット変換/構造化変換/データモデルの変換/重複排除などのプロセスにより、ターゲットデータストアに 互換性のある形に変換する • 取り込み: • 変換結果がターゲットシステムで物理的に保存するか、提供される どのように実現されるか
• Data Factory の豊富なコネクタとパイプライン(EL) および、 データフローGen2(ETL) が OneLake にデータを取り込みます。 Synapse
Data Engineering の提供する Spark は複雑なETLを実行します。 Microsoft Fabric のデータ統合キーワード DMBOK キーワード Fabric 機能 • クラウドベース統合: 豊富なコネクタとサーバレス環境でのETLプロセス実行 • オーケストレーションとプロセスコントロール ETLプロセスの順序ならびにその整合性を保証する • Data Factory のパイプライン には フォールトトレランス、ログ、監視機能を備えた オーケストレーション機能があり、 ノーコードで複雑な依存関係を簡単にキャンバス上に作成で きます。 • データフェデレーションと仮想化 異なるデータストアにデータ存在する場合でも物理的 な統合以外の手段でデータを統合する • OneLake のショートカット は、 Azure / AWS / GCP といった主要なクラウドサービスにおけるオブジェクトストレージから データを移動をすることなく、データアクセスを提供します。 • データ交換標準 データの形式を標準化し、データ相互運用性を高め てデータの交換運用を統制する • OneLake 上にあるデータは一貫したURLでアクセスが可能です。 変換したデータは Delta Parquet に標準化されますが、 オープンスタンダードなフォーマット特性から Fabric に限らずさまざまな分析環境で再利用が 可能です。
• Docs の記載にあるように、完全な機能マッピングはできないものになっている。 • Fabric と Azure の Data Factory
の違い - Microsoft Fabric | Microsoft Learn • 主要な差異 • マッピングデータフローは Fabric では提供されず、データフローGen2が移行先となる • 統合ランタイム、データセットに類似する概念はない • セルフホステッド統合ランタイムについては現在ではオンプレミスデータゲートウェイがマッピングされるが、デザイン 中である • アクティビティの種類は追加中の状況だが、Teams , OutlookアクティビティなどAzureではlogic apps などを組み合わせて行うような処理がビルトインされた Azure Data Factory ≠ Fabric Data Factory ?
Fabric データ統合手法選定 2023/07版 オンプレミスデータストア オンプレミスデータゲートウェイとデータフロー Gen2 *パイプラインによるオンプレミスデータ統合を含めて設計中 One Lake ショートカットによる仮想統合
クラウドデータストア Synapse Link による、No-ETLによる物理統合 *一部計画中 オブジェクトストレージ Synapse SQL Pool / Dataverse / Cosmos DB データフロー Gen2 or パイプライン による物理統合 RDBMS/クラウドサービス その他 要件により選択可能 要件により選択可能 ソース ソリューション
オンプレミスデータゲートウェイとデータフローによる SQL Server データの物理統合 SQL Server ローカルラップトップ オンプレミスデータゲートウェイ Microsoft Fabric
Data Factory データフロー Gen2 レイクハウス Synapse Data Engineering OneLake Delta Parquet (データの実体) テーブル (メタデータ) 参照
OneLake による仮想統合 with Azure Databricks Microsoft Fabric Data Factory データフロー
Gen2 レイクハウス Synapse Data Engineering OneLake Delta Parquet (データの実体) テーブル (メタデータ) Azure Databricks Spark Cluster SQL Warehouse Databricks Computing ML SQL・BI 参照