Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amazon CloudWatch Application Signals ではじめるバーン...

Amazon CloudWatch Application Signals ではじめるバーンレートアラーム / Burn rate alarm with Amazon CloudWatch Application Signals

AWS Startup Loft 春の Observability 祭り 2025での登壇資料です。
https://bit.ly/3EZZaAD

JAWS-UG DE&Iでもお話しました。
https://jawsugdei.connpass.com/event/352867/

Avatar for ymotongpoo

ymotongpoo

April 16, 2025
Tweet

More Decks by ymotongpoo

Other Decks in Technology

Transcript

  1. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 1 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon CloudWatch Application Signals ではじめるバーンレートアラーム Yoshi Yamaguchi (@ymotongpoo) J A W S - U G D E & I + S T A R T U P C O M M U N I T Y Senior Developer Advocate Amazon Web Services Japan, G.K.
  2. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 2 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. ⾃⼰紹介 ⼭⼝ 能迪(やまぐち よしふみ) アマゾンウェブサービスジャパン合同会社 シニアデベロッパーアドボケイト 専⾨領域 • オブザーバビリティ • SRE全般 @ymotongpoo
  3. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 4 • バーンレート計測の重要性 • Application Signals による SLO モニタリング アジェンダ
  4. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 5 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. バーンレート計測の重要性
  5. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 6 サービスレベル指標 SLI / サービスレベル⽬標 SLO 信頼性 = ユーザーがサービスに期待する性能品質 = システムメトリクスではない SLI SLO
  6. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 7 サービスレベル指標 SLI / サービスレベル⽬標 SLO SLI = ユーザーがサービスに期待する性能品質 = 良いイベント/時間 全イベント/時間 例1: チケットの予約にかかる時間(レイテンシー) 500ms以内のレスポンスの数 全レスポンスの数 例2: 予約ページにアクセスできる時間(可⽤性) アクセスできてた時間 計測中の全期間
  7. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 8 SLO だけ⾒てれば安⼼︕なのか…︖ SLI: レイテンシーが1800ms以下 SLO: 28⽇間で90% 80 82 84 86 88 90 92 94 96 98 良いレイテンシーの割合 SLI 90% しきい値でアラームを設定してたら…
  8. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 9 アラーム疲れ alarm fatigue 重要でないアラームが多すぎることで 疲弊し、重要なアラームを⾒逃してし まう状況。 アラームはアクションが必要な状況で のみ発報すべき WAF: OPS08-BP04 Create actionable alerts c.f. • Amazon DevOps Guru • Amazon CloudWatch 複合アラーム
  9. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 10 エラーバジェット エラーバジェット = 100% - SLO 余裕がある SLO違反 SLO SLO SLI エラーバジェット 新規開発のリスクが取れる すでに信頼性を毀損している 100% 90% 97% 93% ユーザーに影響がでている
  10. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 11 バーンレートアラーム 思ってたよりエラーバジェットが速く減ってたら知らせる エラーバジェット 時間 28d 14d 2.8d 100% バーンレート10: 緊急事態の減り⽅ バーンレート2: 予想よりは速いけど 余裕はある バーンレート1: 予想した通りの減り⽅
  11. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 12 ルックバックウィンドウ 消費速度が速い場合は短い時間で気が付かないと意味がない エラーバジェット 時間 28d 100% ルックバックウィンドウ 12時間 ルックバックウィンドウ 3⽇ ルックバックウィンドウ 28⽇
  12. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 13 関係図 SLIとSLO エラーバジェット バーンレート 指標と計測期間と⽬標値を決めるだけ (割り算の計算式を決めるだけ) エラーバジェットの差分をローリングで計算し続ける (2次計算) ⼀定期間のデータをローリングで計算し続ける (1次計算) バーンレートアラームを⾃分で実装するのは多少⼿間がかかる
  13. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 14 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. Application Signals による SLO モニタリング
  14. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 15 テレメトリデータ ⾃動収集 Amazon CloudWatch Application Signals アプリケーションの状態を把握・分析するための情報を⾃動で収集・可視化 サービスの検出/ トポロジー可視化 ダッシュボード提供 トレース・メトリクスの 確認 CloudWatch Synthetics / CloudWatch RUM との連携 SLO モニタリング
  15. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 16 Application Signals がサポートされる環境 アーキテクチャ プログラム⾔語 Amazon EKS Amazon ECS Amazon EC2 awsvpc ネットワーク モードのみ EC2 / Fargate EC2 / Fargate コンテナ以外の アプリケーションも 実装可能 Python 3.8+ Java 8, 11, 17 .NET .NET 6, 8 .NET Framework 4.6.2+ Node.js 14, 16, 18, 20, 22 AWS Lambda
  16. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 17 Application Signals の有効化の例 Lambda ではワンクリックで設定可能 ここをチェックするだけ
  17. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 18 Application Signals のダッシュボード SLO モニタリング サービス ダッシュボード サービスマップ サービス インサイト、ログ トレース RUM※ カナリア ※ ※必ず利⽤しなければならないわけではありません
  18. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 19 SLOダッシュボード SLIのSLOに対する現状を把握、バーンレートも⾒れる
  19. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 20 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. デモ: SLI→SLO→バーンレートアラーム
  20. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 21 SLI の設定 Application Signals ではサービスの操作に関わる指標を SLI とすることを想定 サービスレベル⽬標 (SLO) > サービスレベル⽬標 (SLO) を作成 サービス >「サービス」セクション サービスレベル⽬標 (SLO) > 「サービスレベル⽬標 (SLO) 」セクション
  21. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 22 SLO の設定 フォームに沿って⼊⼒していくだけ
  22. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 23 バーンレートアラーム CloudWatch アラームまで設定 まずバーンレートを計算する期間を設定 各ルックバックウィンドウで バーンレートアラームを設定
  23. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 24 まとめ バーンレートアラームは理由がわかりやすい︕ Application Signals でバーンレートアラームを設定しましょう︕
  24. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 25 Thank you! © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. Yoshi Yamaguchi @ymotongpoo Any questions?