Slide 23
Slide 23 text
© 2024, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon Confidential and Trademark.
ユースケース 2: ログ分析
S3 に出⼒される様々な AWS サービスのログや収集データに対してクエリ
https://docs.aws.amazon.com/ja_jp/athena/latest/ug/querying-AWS-service-logs.html
https://docs.aws.amazon.com/awsaccountbilling/latest/aboutv2/athena.html
https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-inventory-query.html
https://aws.amazon.com/jp/about-aws/whats-new/2019/08/amazon-athena-supports-querying-data-from-amazon-s3/
• Elastic Load Balancing (ALB/CLB/NLB) ログ
• Amazon CloudFront ログ
• AWS CloudTrail ログ
• Amazon EMR ログ
• AWS Global Accelerator ログ
• Amazon GuardDuty ログ
• Amazon VPC フローログ
• AWS WAF ログ
• AWS Cost and Usage Reports データ
• AWS Systems Manager インベントリデータ
• Amazon S3リクエスタ⽀払いバケットデータ
S3 Athena
横断的な分析の難しさ
ログの形式に一貫性がないので、クエリが複雑化。一貫した分析をするためには正規化等が必要
マルチアカウントでデータ収集時は、所有権問題等も発生
23
3
© 2021, Amazon Web Services, Inc. or its affiliates. All rights reserved.
応⽤
(可視化等)
データレイクを中⼼とした構成︓データの流れ
• 多様な⽣データをデータレイクに蓄積
• データレイクの機能の1つに、前処理を含む
収集
データレイク
処理系
(DWH,RDB等)
応⽤
(可視化等)
収集&格納
処理系
(DWH,RDB等)
カタログ
(メタデータ)
変形・整形
(前処理)
蓄積
⽣データ
整形・
最適化済
AWSのETLソリューション紹介 より https://pages.awscloud.com/rs/112-TZM-766/images/AWS-ETL-Solutions-202107.pdf
AWS BlackBelt Amazon Athena より https://pages.awscloud.com/rs/112-TZM-766/images/20200617_BlackBelt_Amazon_Athena.pdf