Slide 7
Slide 7 text
©2024 Databricks Inc. — All rights reserved
レイクハウスの基本概念
レイクハウスとは端的に言うと以下の様なものであると言える
▪ データウェアハウスとデータレイクの利点を組み合わせたデータ管理アーキ
テクチャ
▪ Apache Parquetなどのオープンなファイル形式を基盤とし、ACIDトランザク
ション、バージョニング、インデックスなどを提供
▪ BI分析からAI/MLまで、複数ワークロードを単一のプラットフォームで効率的
に処理可能
▪ 複雑なETLは不要、データの鮮度を保ちコストを削減可能
▪ 直接アクセス可能、オープンな形式を採用し、ベンダーロックインを極小化、
柔軟なデータ活用を実現