Slide 7
Slide 7 text
AWS Glueとは
AWSが提供するサーバーレスなデータ統合サービス
● PythonとApache Sparkを使った大量データの処理(Glue ETL
Job)
● データ資産のカタログ化(Glue Data Catalog)
● GUIでのジョブ作成(Glue Visual Editor/Glue Data Brew)
などの様々な機能が提供
Crawler Data Catalog
S3 Bucket
Amazon Athena
Amazon QuickSight
Amazon Redshift
ETL Job
データソース
2023年6月、データ品質検査を担う
Glue Data Qualityが一般提供開始