Slide 4
Slide 4 text
4
Oracle Modern Data Platform Reference Architecture
- MySQL HeatWave Lakehouse
Copyright © 2024, Oracle and/or its affiliates
7
8
9 10
11
データ前処理/変換/集計: Data Integration / SQL Code / Other Tools /
Data Transforms(OCI GG)
データウェアハウスに蓄積されたのデータを分析しやすくするために処理します。
Data IntegrationやSQL Plus、SQL Developerなどで記述したSQL、dbtなどといった他のツールからデータ処理を行います。また業務に合わ
せた目的別のデータマートも作成します。
参考: クレデンシャル・ウォレットを利用して接続してみよう
7
8
9
10
11
12
データウェアハウス: MySQL HeatWave
各システムのデータを集約し、分析しやすくなるよう整理されたデータの倉庫です。
MySQLをベースに、従来MySQLが苦手としていた分析処理も高速に実行できるように拡張されたクラウド・データベース・サービスです。
オブジェクトストレージ上のデータを高速に分析対象にできるMySQL HeatWave Lakehouseもあります。
参考: MySQLで高速分析を体験する
データレイク: Object Storage
さまざまなデータソースからのデータを加工せずに、元の形式のまま保管する器です。
Object Storageを利用することで、さまざまなデータをストレージの容量を気にせず低コストで蓄積することが可能です。
参考: オブジェクト・ストレージの概要 / データレイク
ビッグデータ処理: Data Flow / Big Data
データレイクに蓄積された大量データを処理するために、大規模並列処理を行います。
Data Flowを使うことで、Object Storageとネイティブに接続しデータを処理できます。Big Data ServiceはHadoopのクラスタからOracle
SQLを使用してObject Storageのデータを処理できます。
参考: OCI Data Flow ハンズオン(初級編) / Big Data Service, Cloud SQL 概要
データカタログ: Data Catalog
組織内にあるデータ資産の整理された一覧です。
OCI Data Catalogはデータエンジニアがデータ資産を整理し、データガバナンスをサポートするのに役立つサービスです。
参考: データカタログとは?なぜそれが必要なのか?
セマンティックレイヤー: Analytics Cloud Service
ユーザーが一般的なビジネス用語でデータにアクセスできるように整理された抽象化レイヤーです。ビジネスの構造に従って、分析用のデータを提示
できるように設計されています。
Analytics Cloud Serviceではセマンティック・モデラーを使用してセマンティックレイヤーを構築することができます。
参考: データのモデル化
12