Slide 25
Slide 25 text
Serving Layer - Glue Data Catalog
24
CONFIDENTIAL © 2018 primeNumber Inc.
● ETL後のデータはGlueのData Catalogに登録して再利用性向上
○ Glue Data CatalogはCrawlerから作成できるメタデータ
○ Redshift Spectrum、Athena、EMRからテーブルとして扱える
○ AWS GlueのCrawlerを実行すればすぐ作れる
● データのアーカイブ用途でも利用可能
○ 過去データ等、利用頻度は少ないが削除するかは悩ましい場合
○ S3に退避してData Catalog化しておけば解決
① Glue CrawlerでS3上のログを
クローリングし、Data Catalog作成
② Redshift上でテーブルとして扱えるように