Slide 7
Slide 7 text
© 2025 Classmethod, Inc.
6
従来のデータ分析基盤には、大きく分けて「DatawareHouse(DWH)」と
「DataLake」という2つのアプローチがあり、それぞれに特性がある。
なぜ今、LakeHouseなのか?
比較項目 DatawareHouse (DWH) DataLake (Data Lake)
主な用途 BI、ビジネスレポート、定型分析 AI、機械学習、データ探索
扱うデータ 構造化データ (2次元の表データ) あらゆるデータ (構造化、非構造化)
データ形式 独自のストレージ形式 オープンなファイル形式 (Parquet, CSV, JSON,
画像)
スキーマ スキーマ・オン・ライト (書き込み時に厳格
に検証)
スキーマ・オン・リード (読み込み時に柔軟に解
釈)
長所 高速な集計、高い信頼性、ガバナンス 低コスト、高い柔軟性、拡張性
短所 高コスト、柔軟性の欠如、AI/MLに不向き 品質の担保が困難、ガバナンス欠如