affiliates. All rights reserved. Amazon Confidential and Trademark. Site Reliability Engineering サービスの可用性、レイテンシ、パフォーマンス、効率性、変更管理、 モニタリング、緊急対応、キャパシティプランニング…
affiliates. All rights reserved. Amazon Confidential and Trademark. サービス状態や実際の利用状況をモニタリングする 障害の把握や性能改善、機能改善につながる洞察を得る HW OS MW Application Client/Front Internet NW モニタリング対象
affiliates. All rights reserved. Amazon Confidential and Trademark. サービス状態や実際の利用状況をモニタリングする 障害の把握や性能改善、機能改善につながる洞察を得る インフラに限定せずアプリケーションまで含めて サービスを“総合的に”評価する必要がある HW OS MW Application Client/Front HW OS MW Application Client/Front Internet Internet NW NW モニタリング対象
affiliates. All rights reserved. Amazon Confidential and Trademark. サービスを提供する側から見た正常性確認 14 サービス状態を提供側の環境から継続的にテストし、 提供するサービスの品質・信頼性をモニタリングする Internet モニタリング範囲 ユーザー/クライアント サービスプロバイダ
affiliates. All rights reserved. Amazon Confidential and Trademark. サービスにおける障害点・ボトルネックの特定 18 障害原因の特定やパフォーマンスボトルネック特定は難しい一方で、 サービス全体の性能・品質に影響を与える可能性がある Service A Service D Service B Service F Service C Service E Service G
affiliates. All rights reserved. Amazon Confidential and Trademark. CloudWatch ServiceLens AWS X-Rayと連動することでサービス間の依存関係や レイテンシ、レスポンス状態について視覚的に把握することが可能 参考:AWS X-Ray BlackBelt https://www.youtube.com/watch?v=biYBazxFwxk&list=PLz WGOASvSx6FIwIC2X1nObr1KcMCBBlqY&index=28 Service mapでノードとメトリクスを関連付けて確認 Service mapでトレースの詳細を見る Service mapでレスポンスタイムをチェック
affiliates. All rights reserved. Amazon Confidential and Trademark. インターネットが与える影響を確認する 21 モニタリング範囲 Internet ユーザー/クライアント サービスプロバイダ インターネットの影響をモニタリングし、 ユーザーのエクスペリエンスを向上する活動に役立てる
affiliates. All rights reserved. Amazon Confidential and Trademark. ユーザー視点でのレイテンシー、エラー 24 実際のユーザーの利用状況およびデータをモニタリングすることで 環境差異による影響や想定していない問題の早期発見、改善検討につながる モニタリング範囲 Internet ユーザー/クライアント サービスプロバイダ
affiliates. All rights reserved. Amazon Confidential and Trademark. メトリクスフィルタ × Metric Math 正常なレスポンスのうちレイテンシの大きかった割合を把握できる メトリクスフィルタによるWebサーバのアクセスログのメトリクス化 count ( status_code:200 and 高レイテンシ) count ( status_code:200) メトリクスフィルタ Metric Math Webサーバ access_log