20220310_7th_AzureDataAndAITechLunch

Slide 1

Slide 1 text

データ基盤とSynapseの全体像ざっくり解説 Hirosato Gamo ※解釈しやすいようにかなりシンプル化してます。正確な解説は公式ドキュメント参照

Slide 2

Slide 2 text

データ基盤の基本構成ストリーミングデータ (センサー, IoT) 構造化データ (RDB, CSV) 半構造化データ (XML, JSON, YAML) 非構造化データ (画像, 音声, 自然言語) 生データ ⚫フィルタ済み ⚫Parquet変換 ⚫クレンジング etc… 半生データデータレイク変換・フィルタ探索的な分析・開発固定化された用途アドホック分析 AI開発ダッシュボード集計・加工 MAなどビジネスツールデータマート DWH オブジェクトストレージ RDB 集計・加工ロードデータ基盤データソースストリーム処理 ➢ サーバレスSpark ➢ サーバレスDWH ➢ ETLツール ➢ サーバレス関数 etc. ➢ Spark ➢ ETLツール ➢ サーバレス関数 etc. ➢ MQTTブローカー ➢ 分散キュー ➢ ストリーム処理ツール etc. ➢ ETLツール etc. ➢ Spark ➢ DWH ➢ ETLツール etc. ➢ オブジェクトストレージ (オンプレではHDFSなど) ➢青字はSynapse の提供される範囲(イメージ) ※解釈しやすいようにかなりシンプル化してます。正確な範囲は公式ドキュメント参照。

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text