Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Observabilityジャーニーを実現するためのAWSサービス:CloudWatch編

 Observabilityジャーニーを実現するためのAWSサービス:CloudWatch編

o11yfes

May 07, 2024
Tweet

More Decks by o11yfes

Other Decks in Technology

Transcript

  1. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 春 の O b s e r v a b i l i t y 祭 り 2 0 2 4 ~ O b s e r v a b i l i t y 獲 得 ま で の 旅 ~ Observabilityジャーニーを実現するための AWSサービス︓CloudWatch編 Miki Tsuwazaki 1 9 : 2 5 - 1 9 : 4 0 J S T Amazon Web Service Japan G.K. Solutions Architect
  2. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. ⾃⼰紹介 津和崎 美希 アマゾンウェブサービスジャパン ソリューションアーキテクト 経歴︓ 前職ではSIerにて、オンプレミス・クラウドでの構築/ 運⽤を担当。 主な業務内容はインフラ設計/構築/試験/運⽤/移⾏/ 追加構築計画・実作業と幅広く担当。 好きなサービス(良くしていきたいサービス)︓ Amazon CloudWatch
  3. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. • AWSモニタリングの最初の選択肢としてのCloudWatch • AWS Observability Maturity Modelに沿ったCloudWatchの活⽤ Agenda
  4. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWSモニタリングの最初の選択肢としての CloudWatch
  5. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Overview Observability Collectors and SDKs Container insights Lambda insights Contributor insights Application insights Synthetics Dashboards Alarms RUM AWS X-Ray AWS native services Amazon CloudWatch ServiceLens Open-source managed services Amazon Managed Grafana Do it yourself (DIY) – AWS OSS Solutions Amazon OpenSearch Service Amazon Managed Service for Prometheus Jaeger and Zipkin Tracing Insights & ML Instrumentation Metrics CloudWatch agent AWS X-Ray agent AWS Distro for OpenTelemetry Internet monitor Logs 本セッションの範囲
  6. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. CloudWatch / X-Ray は最初の選択肢 • AWS サービスに対するビルトインの メトリクスやログ、トレースが利⽤可能 特に準備不要でテレメトリデータの収集を始められる e.g. EC2、RDS、Lambda、ECS、S3、DynamoDB…more • AWS サービスとのインテグレーションが容易 テレメトリデータの S3 へのバックアップ Alarm からのオートメーション処理 …more • 1 プラットフォームで完結できる 再掲 CloudWatchでObservabilityを始められるのはわかった。 では、各Stageで何ができるのか︖
  7. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 現在の機能(22項⽬)で他のユースケースにも AWSサービス名 概要 ⼤阪リージョン 有・無 CW Dashboard ダッシュボード 有 CW Alarm アラーム 有 CW Logs ログ 有 CW Log Anomalies ログ異常検知(機械学習機能) 有 CW Log Live Tail ライブテール 有 CW Logs Insights ログ分析 有 CW Metrics メトリクス(メトリクス分析もこちら) 有 CW Metrics Explorer メトリックス検索 有 CW Metrics Stream メトリックスのリアルタイム連携 有 X-Ray traces トレース 有 CW Events ※Event Bridgeに統合 イベント 有 CW Application Signals (Preview) SLO/SLIベースとしたアプリケーションモニタ リング機能 無 CW Synthetics 外形監視 有 CW RUM リアルユーザーモニタリング 有 CW Evidently フィーチャーフラグA/Bテスト 無 AWSサービス名 概要 ⼤阪リージョン 有・無 CW Internet Monitor インターネット監視 有 CW Network Monitor ネットワーク監視 無 CW Container Insights コンテナ分析 有 CW Lambda Insights Lambda分析 有 CW Contributor Insights ログの時系列分析 有 CW Application Insights アプリケーション分析 有 CW EC2 Resource Health EC2の健全性・パフォーマンス可 視化 有 さまざまな機能を組み合わせて サービスに⼤切なものを監視する ※CWはCloudWatchの略
  8. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Maturity Modelに沿った CloudWatchの活⽤
  9. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Maturity Model Stage 成熟度 Stage 1: 基本的なモニタリング Stage 2: 中級レベルの モニタリング Stage 3: ⾼度な オブザーバビリティ Stage 4: 予測的 オブザーバビリティ テ レ メ ト リ デ ー タ の 収 集 テ レ メ ト リ の 分 析 と イ ン サ イ ト 相 関 関 係 と 異 常 検 知 自 動 か つ 予 測 的 な 根 本 原 因 の 特 定
  10. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Maturity Model Stage 成熟度 Stage 1: 基本的なモニタリング Stage 2: 中級レベルの モニタリング Stage 3: ⾼度な オブザーバビリティ Stage 4: 予測的 オブザーバビリティ テ レ メ ト リ デ ー タ の 収 集 テ レ メ ト リ の 分 析 と イ ン サ イ ト 相 関 関 係 と 異 常 検 知 自 動 か つ 予 測 的 な 根 本 原 因 の 特 定
  11. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 3本柱のAWSサービスにObservability のデータをカスタムで収集する⼿段 メトリクス トレース ログ Amazon CloudWatch Metrics AWS X-Ray Amazon CloudWatch Logs CloudWatchで⾏う場合、 統合CloudWatchエージェント ですべて集められる SaaS その他 OSS AWS X-Rayに送信す るよう統合 CloudWatchエージェ ントを設定できる
  12. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. X-Rayとの統合 X-Ray サービスマップと CloudWatch ServiceLens マップは、 Amazon CloudWatch コンソール内の X-Ray Trace Mapに統合されています。
  13. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 顧客体験の向上につながるテレメトリデータ • 定常的に⼀定間隔で計測プログラムが アクセスし、パフォーマンスを計測 • 短期のパフォーマンス計測⽤途に好適 • 実ユーザーアクセスの情報を取得して計測 • 中⻑期のユーザー傾向把握⽤途に好適 Synthetic Monitoring [外形監視] Real User Monitoring [リアルユーザー監視] ユーザーに近いテレメトリデータを取得する レスポンスタイム、リクエスト成功率、エラー率(4xx, 5xx)など 再掲
  14. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 顧客体験の向上につながるテレメトリデータ Synthetic Monitoring [外形監視] Real User Monitoring [リアルユーザー監視] CloudWatchでも実現可能 Amazon CloudWatch Synthetics Amazon CloudWatch RUM 堀さんのセッションで紹介予定
  15. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Amazon CloudWatch RUM(Real User Monitoring) アプリのパフォーマンスに関するクライアントサイドのデータをリアルタイムで取得し、 ユーザー体験を最適化 • リアルユーザーのパフォーマンスを モニタし、ブラウザ やデバイスの種類、位置、ネットワークの接続性の問題 などを把握できる • ダッシュボードでページの読み込み 順序や JavaScript / HTTP レスポ ンスのエラーなど、パフォーマンス 問題に関する情報を可視化 • 同じ問題の影響下にあるユーザー セッション数を提⽰するため、改修 の優先順位を付けることが容易 17 Web バイタルデータ等、Webブラウザ統計 や ユーザー 挙動の可視化・分析のためのダッシュボードを提供
  16. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Maturity Model Stage 成熟度 Stage 1: 基本的なモニタリング Stage 2: 中級レベルの モニタリング Stage 3: ⾼度な オブザーバビリティ Stage 4: 予測的 オブザーバビリティ テ レ メ ト リ デ ー タ の 収 集 テ レ メ ト リ の 分 析 と イ ン サ イ ト 相 関 関 係 と 異 常 検 知 自 動 か つ 予 測 的 な 根 本 原 因 の 特 定
  17. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. インシデントの際、どのように対応しますか︖ ポストモーテム Amazon での対応例 様々なツール による分析 アラーム ダッシュボード メトリクス分析 ログ分析 ⽣ログ トレース 抽 象 度 ⾼ 低
  18. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. X-Rayでのユーザー体験の監視 外形監視の状況もx-Ray で⼀元的に確認 リアルユーザー監視で エンドユーザーからのアクセス も確認 ユーザー体験の低下が判明したら問題箇所をトレースから特定
  19. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. X-Rayでの問題箇所の分析 ①トレースマップからアイコンを クリック ②レイテンシや エラー率を確認 ③同⼀の画⾯でメトリクスを確認 したり、ログの表⽰からLogs Insightsで該当のログを確認し根本 原因調査
  20. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. CloudWatchで完結する シンプルなメトリクス・ログ分析 [メトリクス] CW Metrics [ログ] CW Logs [ログ分析] CW Logs Insights メトリクスを送信 ログを送信 ログの可視化 AWSサービス オンプレミス/EC2 CW Agent [メトリクス分析] CW Metrics Insights ※CWはCloudWatchの略
  21. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. CloudWatch Metric Insights OR 例)ProductInfoService の名前空間に対して Operation ごとのエラー合計で Top5 を表⽰ • 柔軟なクエリ機能により、リアルタイムでメトリクスの集計やグルーピング • SQL ベース のクエリや選択式のビルダーで実⾏ メトリクスを効率よく分析 メトリクスのリアルタイム集計・可視化 Insights
  22. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. CloudWatch Logs Insights 例)1時間あたりの例外発⽣件数の⼀覧を取得する クエリ クエリ結果 • CloudWatch Logs でログデータをインタラクティブに 検索・分析 • 専⽤のクエリ⾔語 • 時系列データの可視化、個々のログイベントへのドリ ルダウン、クエリ結果の CloudWatch ダッシュボード へのエクスポート ログを効率よく分析 CloudWatch Logs Insightsではログデータの検索・分析だ けでなく、bin() 関数を使⽤するクエリを実⾏して、返され た値を期間別にグループ化すると、結果を折れ線グラフ、 円グラフ、棒グラフ、積み上げ⾯グラフとして表⽰可能。 ログから実⽤的な洞察を導き出す Insights
  23. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. CloudWatch Logs Live Tailでニアリアルタイムなログ分析も ログをニアリアルタイムで確認 する際も、 例えば、IPレンジでフィルター したい時、 ip=%10¥.0¥.0¥.[1-9]% のような正規表現をフィルター パターンで使うことができる。 https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/FilterAndPatternSyntax.html#regex-expressions ⼀ 般 利 ⽤ 開 始
  24. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. CloudWatch Alarmsでメトリクスをアクションにつなげる メトリクス アクション Amazon CloudWatch Amazon EC2 Amazon SNS Amazon EC2 Auto Scaling Alarm OK ALARM INSUFFICIENT_DATA 正常値 ü 定義された閾値を下 回っている 異常値 ü 定義された閾値を上 回っている 判定不能 ü データ不⾜のため状 態を判定できない ü CloudWatch特有 AWS Systems Manager OpsCenter AWS Systems Manager Incident Manager ①静的閾値に基づくアラーム ▪例︓5分間平均のCPU使⽤率が90%を6つの評価期間に2回以上発⽣ =30分の評価間隔で閾値超え2回ならばアラーム ※Event Bridgeにも アラーム状態変化は 配信される ②Metrics Insights クエリに基づく CloudWatch アラーム ▪例︓フリートのすべてのインスタンスの CPU 使⽤率を監視する →アラーム作成後の追加インスタンスにも監視が⾃動で適⽤される ③CloudWatch 異常検出に基づいたアラーム ▪例︓最⼤2週間分のErrorCountメトリクスに機械学習アルゴリズムを適⽤して、メトリクス の想定値のモデルから“正常の範囲”を超えてErrorがある場合、突然の変化として検出する ④複合アラーム (例︓①と③両⽅ALARM状態のときにSNSトピックに通知する※EC2アクション未対応) メトリクスアラームの状態 状態が変わったときに実⾏するアクションが指定できる
  25. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Maturity Model Stage 成熟度 Stage 1: 基本的なモニタリング Stage 2: 中級レベルの モニタリング Stage 3: ⾼度な オブザーバビリティ Stage 4: 予測的 オブザーバビリティ テ レ メ ト リ デ ー タ の 収 集 テ レ メ ト リ の 分 析 と イ ン サ イ ト 相 関 関 係 と 異 常 検 知 自 動 か つ 予 測 的 な 根 本 原 因 の 特 定
  26. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. CloudWatch Anomaly Detection(異常検出) • メトリクスの過去のデータに機械学習アルゴリズムを適⽤して、メトリクスの期待値のモデルを作成。 • モデルは、メトリクスのトレンドと時間単位、⽇単位、週単位のパターンの両⽅を評価。 • アルゴリズムは最⼤ 2 週間のメトリクスデータを対象にするが、メトリクスに 2 週間のデータが含まれていな い場合でも、異常検出を有効にできる。 https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html メトリクスの想定値を⽰す異常検出バンドを 追加するには、メトリクスの横にある [アクション] で異常検出アイコンを選択
  27. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 33 ⼀ 般 利 ⽤ 開 始 Amazon CloudWatch Logsの⾃動パターン分析とAnomaly Detection • 何千ものログを少数のパターンにまと める • ログインサイトの新しい比較モードで 何が変わったかをすばやく確認 • 既知および未知の挙動に関する自動イ ンサイト • スケールが必要なケースでより迅速で 豊富な洞察
  28. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Alarm recommendations CloudWatch がアラームの推奨事項を提供。 推奨されるアラームのコードとしてのインフラストラクチャのアラーム定義は、AWS CloudFormation、 AWS コマンドライン インターフェイス (CLI)、または Terraform を使⽤してダウンロードできます。 ⼀ 般 利 ⽤ 開 始
  29. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Amazon DevOps Guru 機械学習で運⽤データとアプリケーションのメトリクスおよびイベントを分析し、 通常の運⽤パターンから逸脱する動作を特定。 現在および予測される将来の問題に対処するためのレコメンデーションを提⽰。
  30. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Maturity Model Stage 成熟度 Stage 1: 基本的なモニタリング Stage 2: 中級レベルの モニタリング Stage 3: ⾼度な オブザーバビリティ Stage 4: 予測的 オブザーバビリティ テ レ メ ト リ デ ー タ の 収 集 テ レ メ ト リ の 分 析 と イ ン サ イ ト 相 関 関 係 と 異 常 検 知 自 動 か つ 予 測 的 な 根 本 原 因 の 特 定
  31. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. ⽣成 AI により予測的な Observability が⼀般的になる⽇を待ちながら Amazon CloudWatch Metrics Amazon CloudWatch Logs AWS X-Ray Amazon Bedrock テレメトリー データ 対象 システム ⽣成AI Agent 収集 収集 収集 分析 修復アクション • 将来、⽣成 AI を利⽤することで、 テレメトリデータをもとに、対象シ ステムの障害の予兆をとらえ、解決 策を提⽰、場合によっては修復を⾏ う、予測的なモニタリング機能が登 場してくることが予想されます。 • AWS は多数のサービスを提供し、 組み合わせられるようにしています。 (Building block) • まず、必ず必要になるテレメトリー データを収集しておきましょう︕ 解決策提⽰ 運⽤者
  32. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Thank you!