Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Observabilityジャーニーの全体像

Avatar for Mitsuaki Tsugo Mitsuaki Tsugo
April 29, 2024
920

 Observabilityジャーニーの全体像

AWS Observability Maturity ModelをベースにObservabilityにおける指標とロードマップ策定、システム実装以外の取り組みについて説明しています。

Avatar for Mitsuaki Tsugo

Mitsuaki Tsugo

April 29, 2024
Tweet

Transcript

  1. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 春 の O b s e r v a b i l i t y 祭 り 2 0 2 4 ~ O b s e r v a b i l i t y 獲 得 ま で の 旅 ~ Observabilityジャーニーの全体像 Mitsuaki Tsugo 1 9 : 0 5 - 1 9 : 2 5 J S T Amazon Web Service Japan G.K. Solutions Architect DETECT INVESTIGATE REMEDIATE
  2. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. ⾃⼰紹介 津郷 光明 アマゾンウェブサービスジャパン ソリューションアーキテクト 製造業のお客様を中⼼にご⽀援しています DevOpsの推進に貢献します Observability / IaC
  3. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. What is Observability? • システムの動作状況を把握できている状態 • システム運⽤において、判断に必要な情報が網羅的に 取得できている状態 状態の可視化 リアルタイムな 障害対応 顧客体験 ビジネスの評価 洞察を得る Operational Business
  4. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Observabilityでよく利⽤されるテレメトリデータ Observability メトリクス ログ トレース 時間間隔で計測されたデータの数値表現 傾向の把握、予測に役⽴つ タイムスタンプが記録された、時間の 経過とともに起こったイベントの記録 予測不可能な振る舞いの発⾒に役⽴つ エンドツーエンドのリクエストフローの記録 リクエストの流れと構造の両⽅を可視化 することで因果関係の追跡に役⽴つ
  5. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Overview Observability Collectors and SDKs Container insights Lambda insights Contributor insights Application insights Synthetics Dashboards Alarms RUM AWS X-Ray AWS native services Amazon CloudWatch ServiceLens Open-source managed services Amazon Managed Grafana Do it yourself (DIY) – AWS OSS Solutions Amazon OpenSearch Service Amazon Managed Service for Prometheus Jaeger and Zipkin Tracing Insights & ML Instrumentation Metrics CloudWatch agent AWS X-Ray agent AWS Distro for OpenTelemetry Internet monitor Logs
  6. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 何から始めれば良いのか︖ どこを⽬指せばいいのか︖
  7. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Best Practices https://aws-observability.github.io/observability-best-practices/ja/
  8. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Maturity Model https://aws-observability.github.io/observability-best-practices/ja/guides/observability-maturity-model/
  9. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS Observability Maturity Model Stage 成熟度 Stage 1: 基本的なモニタリング Stage 2: 中級レベルの モニタリング Stage 3: ⾼度な オブザーバビリティ Stage 4: 予測的 オブザーバビリティ テ レ メ ト リ デ ー タ の 収 集 テ レ メ ト リ の 分 析 と イ ン サ イ ト 相 関 関 係 と 異 常 検 知 自 動 か つ 予 測 的 な 根 本 原 因 の 特 定
  10. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Stage 1 : 基本的なモニタリング テレメトリデータの収集 ⽬指す状態 • (異なるツールの利⽤や断⽚的であっても) テレメトリデータを収集している ⾏うこと • 現状を把握する • 改善のための現実的な⽬標を設定する
  11. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Observe what matters • 顧客体験の向上 • 未知の障害の検知 • 開発効率の向上 • 状態の可視化、共通認識 Observabilityに取り組む⽬的は︖
  12. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. オススメの最初のステップ SLI/SLO 検討・策定 必要なテレメトリデータ の収集 ※まずは⼀部でも良い サービスレベル指標(Service Level Indicator) メトリクスで特定される計測値 サービスの特性を表す 1 つのデータ サービスレベル⽬標(Service Level Objective) ⽬指すべきSLIに対する⽬標値 多くの場合パーセント サービスにおいて⽬標値とされる「適切な信頼性のレベル」 ※SLO サービスレベル⽬標 1章より引⽤
  13. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 顧客体験の向上につながるテレメトリデータ • 定常的に⼀定間隔で計測プログラムが アクセスし、パフォーマンスを計測 • 短期のパフォーマンス計測⽤途に好適 • 実ユーザーアクセスの情報を取得して計測 • 中⻑期のユーザー傾向把握⽤途に好適 Synthetic Monitoring [外形監視] Real User Monitoring [リアルユーザー監視] ユーザーに近いテレメトリデータを取得する レスポンスタイム、リクエスト成功率、エラー率(4xx, 5xx)など
  14. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Stage 2 : 中級レベルのモニタリング テレメトリの分析とインサイト ⽬指す状態 • テレメトリデータを収集するプロセス を明確に定義 • 分析や、問題のデバッグに多くの時間 を費やす ⾏うこと • ポリシーを決め、実践する • 実⾏可能なKPIを定める
  15. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Stage 3 : ⾼度なオブザーバビリティ 相関関係と異常検知 ⽬指す状態 • 組織単位での戦略 • エンドツーエンドのオブザーバビリティ ⾏うこと • 他の重要なシステムと統合 • AI/ML ツールを使⽤して運⽤を⾃動化
  16. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark.
  17. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Stage 4 : 予測的オブザーバビリティ 自動かつ予測的な根本原因の特定 ⽬指す状態 • AI/MLによる根本原因の特定 • ⾃動復旧に向けた仕組み ⾏うこと • 継続的な改善
  18. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. オブザーバビリティと⽣成AIの可能性 計装・実装 データの蓄積 可視化 • モニタリング 分析 アクション • 実装の⾃動化 • データクレンジング • ⾃然⾔語処理によるクエリ • データの可視化⽅法の⾃動⽣成 • アノテーションの⾃動⽣成 • レポートの⾃動⽣成 • 将来予測 • 根本原因の特定 • 最適な対応策の提案
  19. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 無理なく・必要な場所 から取り組む
  20. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. CloudWatch / X-Ray は最初の選択肢 • AWS サービスに対するビルトインの メトリクスやログ、トレースが利⽤可能 特に準備不要でテレメトリデータの収集を始められる e.g. EC2、RDS、Lambda、ECS、S3、DynamoDB…more • AWS サービスとのインテグレーションが容易 テレメトリデータの S3 へのバックアップ Alarm からのオートメーション処理 …more • 1 プラットフォームで完結できる
  21. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. システムの実装だけで 終わりではない
  22. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 実装以外にも取り組みが必要 • ドキュメント作成 • プロセス定義 • 定常業務への取り込み • ⾏動にどう繋げるか • ⽂化の醸成
  23. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 継続的な改善が⼤切 • 現在の状況を理解する • 定期的に振り返る • 改善する Customer experience Collect Improve Act Business stakeholders Customer needs KPIs 改善に終わりはない 状況に合わせて常に変化する
  24. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. まとめ • Observability ジャーニーの参考となる“AWS Observability Maturity Model” • 最初のステップはまずデータを取得すること • そしてAI/MLを利⽤して⾃動化を⽬指す • 実装以外にも様々な取り組みが必要 • ⼀気に全てをやろうとせず、⼩さな⼀歩から始め、改善を繰り返す
  25. © 2024, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Thank you! Mitsuaki Tsugo Amazon Web Service Japan G.K. Solutions Architect