Slide 1

Slide 1 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 1 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon CloudWatch Application Signals ではじめるバーンレートアラーム Yoshi Yamaguchi (@ymotongpoo) J A W S - U G D E & I + S T A R T U P C O M M U N I T Y Senior Developer Advocate Amazon Web Services Japan, G.K.

Slide 2

Slide 2 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 2 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. ⾃⼰紹介 ⼭⼝ 能迪(やまぐち よしふみ) アマゾンウェブサービスジャパン合同会社 シニアデベロッパーアドボケイト 専⾨領域 • オブザーバビリティ • SRE全般 @ymotongpoo

Slide 3

Slide 3 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 3

Slide 4

Slide 4 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 4 • バーンレート計測の重要性 • Application Signals による SLO モニタリング アジェンダ

Slide 5

Slide 5 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 5 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. バーンレート計測の重要性

Slide 6

Slide 6 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 6 サービスレベル指標 SLI / サービスレベル⽬標 SLO 信頼性 = ユーザーがサービスに期待する性能品質 = システムメトリクスではない SLI SLO

Slide 7

Slide 7 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 7 サービスレベル指標 SLI / サービスレベル⽬標 SLO SLI = ユーザーがサービスに期待する性能品質 = 良いイベント/時間 全イベント/時間 例1: チケットの予約にかかる時間(レイテンシー) 500ms以内のレスポンスの数 全レスポンスの数 例2: 予約ページにアクセスできる時間(可⽤性) アクセスできてた時間 計測中の全期間

Slide 8

Slide 8 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 8 SLO だけ⾒てれば安⼼︕なのか…︖ SLI: レイテンシーが1800ms以下 SLO: 28⽇間で90% 80 82 84 86 88 90 92 94 96 98 良いレイテンシーの割合 SLI 90% しきい値でアラームを設定してたら…

Slide 9

Slide 9 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 9 アラーム疲れ alarm fatigue 重要でないアラームが多すぎることで 疲弊し、重要なアラームを⾒逃してし まう状況。 アラームはアクションが必要な状況で のみ発報すべき WAF: OPS08-BP04 Create actionable alerts c.f. • Amazon DevOps Guru • Amazon CloudWatch 複合アラーム

Slide 10

Slide 10 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 10 エラーバジェット エラーバジェット = 100% - SLO 余裕がある SLO違反 SLO SLO SLI エラーバジェット 新規開発のリスクが取れる すでに信頼性を毀損している 100% 90% 97% 93% ユーザーに影響がでている

Slide 11

Slide 11 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 11 バーンレートアラーム 思ってたよりエラーバジェットが速く減ってたら知らせる エラーバジェット 時間 28d 14d 2.8d 100% バーンレート10: 緊急事態の減り⽅ バーンレート2: 予想よりは速いけど 余裕はある バーンレート1: 予想した通りの減り⽅

Slide 12

Slide 12 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 12 ルックバックウィンドウ 消費速度が速い場合は短い時間で気が付かないと意味がない エラーバジェット 時間 28d 100% ルックバックウィンドウ 12時間 ルックバックウィンドウ 3⽇ ルックバックウィンドウ 28⽇

Slide 13

Slide 13 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 13 関係図 SLIとSLO エラーバジェット バーンレート 指標と計測期間と⽬標値を決めるだけ (割り算の計算式を決めるだけ) エラーバジェットの差分をローリングで計算し続ける (2次計算) ⼀定期間のデータをローリングで計算し続ける (1次計算) バーンレートアラームを⾃分で実装するのは多少⼿間がかかる

Slide 14

Slide 14 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 14 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. Application Signals による SLO モニタリング

Slide 15

Slide 15 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 15 テレメトリデータ ⾃動収集 Amazon CloudWatch Application Signals アプリケーションの状態を把握・分析するための情報を⾃動で収集・可視化 サービスの検出/ トポロジー可視化 ダッシュボード提供 トレース・メトリクスの 確認 CloudWatch Synthetics / CloudWatch RUM との連携 SLO モニタリング

Slide 16

Slide 16 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 16 Application Signals がサポートされる環境 アーキテクチャ プログラム⾔語 Amazon EKS Amazon ECS Amazon EC2 awsvpc ネットワーク モードのみ EC2 / Fargate EC2 / Fargate コンテナ以外の アプリケーションも 実装可能 Python 3.8+ Java 8, 11, 17 .NET .NET 6, 8 .NET Framework 4.6.2+ Node.js 14, 16, 18, 20, 22 AWS Lambda

Slide 17

Slide 17 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 17 Application Signals の有効化の例 Lambda ではワンクリックで設定可能 ここをチェックするだけ

Slide 18

Slide 18 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 18 Application Signals のダッシュボード SLO モニタリング サービス ダッシュボード サービスマップ サービス インサイト、ログ トレース RUM※ カナリア ※ ※必ず利⽤しなければならないわけではありません

Slide 19

Slide 19 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 19 SLOダッシュボード SLIのSLOに対する現状を把握、バーンレートも⾒れる

Slide 20

Slide 20 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 20 © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. デモ: SLI→SLO→バーンレートアラーム

Slide 21

Slide 21 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 21 SLI の設定 Application Signals ではサービスの操作に関わる指標を SLI とすることを想定 サービスレベル⽬標 (SLO) > サービスレベル⽬標 (SLO) を作成 サービス >「サービス」セクション サービスレベル⽬標 (SLO) > 「サービスレベル⽬標 (SLO) 」セクション

Slide 22

Slide 22 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 22 SLO の設定 フォームに沿って⼊⼒していくだけ

Slide 23

Slide 23 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 23 バーンレートアラーム CloudWatch アラームまで設定 まずバーンレートを計算する期間を設定 各ルックバックウィンドウで バーンレートアラームを設定

Slide 24

Slide 24 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 24 まとめ バーンレートアラームは理由がわかりやすい︕ Application Signals でバーンレートアラームを設定しましょう︕

Slide 25

Slide 25 text

© 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. 25 Thank you! © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. Yoshi Yamaguchi @ymotongpoo Any questions?