Slide 2
Slide 2 text
データ基盤の基本構成
ストリーミングデータ
(センサー, IoT)
構造化データ
(RDB, CSV)
半構造化データ
(XML, JSON, YAML)
非構造化データ
(画像, 音声,
自然言語)
生データ
⚫フィルタ済み
⚫Parquet変換
⚫クレンジング etc…
半生データ
データレイク
変換・フィルタ
探索的な分析・開発 固定化された用途
アドホック分析 AI開発
ダッシュボード
集計・加工
MAなど
ビジネスツール
データマート
DWH
オブジェクトストレージ
RDB
集計・加工
ロード
データ基盤
データソース
ストリーム
処理
➢ サーバレスSpark
➢ サーバレスDWH
➢ ETLツール
➢ サーバレス関数 etc.
➢ Spark
➢ ETLツール
➢ サーバレス関数 etc.
➢ MQTTブローカー
➢ 分散キュー
➢ ストリーム処理ツール
etc.
➢ ETLツール
etc.
➢ Spark
➢ DWH
➢ ETLツール etc.
➢ オブジェクトストレージ
(オンプレではHDFSなど)
➢青字はSynapse の提供される範囲(イメージ)
※解釈しやすいようにかなりシンプル化してます。正確な範囲は公式ドキュメント参照。