Slide 1

Slide 1 text

CloudWatch Application Signals と APM の入門 21st Aug, みのるんのゲリラ勉強会&インフラ技術基礎勉強会コラボ 『Amazon CloudWatch入門&LT会』 Kento Kimura

Slide 2

Slide 2 text

Self-Introduction ● 所属:Technical Solutions / Sales Engineer ● 担当:パブリッククラウドのアーキテクト知識を活かした  Datadog のプリセールス技術支援 ● 資格:Google Cloud 全 11 資格、AWS 10 資格、Azure 12 資格 ● 表彰:Google Cloud Partner Top Engineer 2023-24 2022-24 APN All AWS Certifications Engineer 2023 Japan AWS Jr.Champion → AWS Community Builder(2024) 木村 健人 (Kento Kimura) Datadog Japan GK History データセンター運用保守 → パブリッククラウド技術支援 → プリセールス技術支援 Community Jr. Champions Meetup, JAWS, Jagu'e'r, CloudNative Days

Slide 3

Slide 3 text

Agenda 3 01 APM 入門 02 APM on AWS 03 CloudWatch Application Signals 04 まとめ

Slide 4

Slide 4 text

4 そもそも APM ってなに?

Slide 5

Slide 5 text

APM APM = Application Performance Monitoring

Slide 6

Slide 6 text

Application Performance Monitoring とは ソフトウェアツールとテレメトリデータを使用して、 ビジネスクリティカルなアプリケーションのパフォーマンスをモニタリングするプロセス ソフトウェアツール: 監視エージェントや Software Development Kit(SDK) などのツール AWS では CloudWatch Agent, X-Ray SDK など テレメトリデータ: CPU 使用率・応答時間・エラー率・レイテンシーなどの監視情報 APM では主にアプリケーションの指標である RED メトリクスを重視 6 引用「APM (アプリケーションパフォーマンスモニタリング ) とは何ですか ?」https://aws.amazon.com/jp/what-is/application-performance-monitoring/ “ “

Slide 7

Slide 7 text

RED メトリクスのいろは ● Requests: アプリケーション処理がリクエストされた回数。処理の種類毎に分類する。 ● Errors: アプリケーションエラーの発生した回数。エラー率を指標とすることが多い。 ● Duration: アプリケーションの処理にかかる時間。p50, p75, p90, p95 などを参照する。 RED メトリクスのようなアプリケーションのメトリクスを把握することで、 CPU・メモリ・ディスクの使用率、ネットワークトラフィックなどのメトリクスに比べ より利用者の体験に即した指標をもとに意思決定ができる。 他にも USE メソッドやゴールデンシグナルなどがあるが、今回は割愛… アプリケーション処理の統計メトリクスだけではなく、 処理毎のパフォーマンスを見るには分散トレーシングが重要 7

Slide 8

Slide 8 text

分散トレースのいろは アプリケーションの処理毎にパフォーマンスを記録する手法は、 従来はアプリケーションログを詳細に設計する必要があった。 処理毎にログを記録すると、情報量とストレージ容量が膨大となる アプリケーション処理の開始・終了時点と最低限のコンテキストを記録して HTTP リクエストでアプリケーション間の依存関係を可視化する 分散トレーシング:情報量を削減し、複雑な処理をフレームグラフなどで可視化する HTTP リクエストを行うマイクロサービス間の処理も可視化できる フレームグラフ:             ウォーターフォール: 8

Slide 9

Slide 9 text

9 APM on AWS

Slide 10

Slide 10 text

APM tools on AWS 10 ADOT (AWS Distro for OpenTelemetry) AWS X-Ray

Slide 11

Slide 11 text

AWS の APM ~X-Ray のハナシ~ AWS X-Ray ● 2017/4 GA(一般公開) ● CloudWatch と別のエコシステム ○ SDK でコードに組み込み ○ Daemon で監視情報の集約 ○ API で AWS へ連携 ○ Browser で可視化 ● 2019/11 CloudWatch ServiceLens ● CloudWatch との連携(メトリクス・ログ) ○ X-Ray と CloudWatch のテレメトリ(監視データ)が、 AWS Console 上で統合される 11 AWS X-Ray AWS Tools and SDKs AWS CLI X-Ray SDKs AWS Cloud Control API AWS Management Console X-Ray daemon

Slide 12

Slide 12 text

AWS の APM ~CloudWatch のハナシ~ Amazon CloudWatch ● AWS 上のリソースをリアルタイムに監視するソリューション ● 2019/11 Console 上の X-Ray 統合 ● 2021/11 ADOT(AWS Distro for OpenTelemetry) がアプリケーショントレースをサポート ● 2023/8 CloudWatch Agent の X-Ray, OpenTelemetry サポート ● 2023/11(AWS re:Invent 2023) CloudWatch Application Signals(preview) が発表 ● 2024/6 CloudWatch Application Signals が GA CloudWatch のエコシステムを中心に APM のサポートを拡大していきそう 12

Slide 13

Slide 13 text

CloudWatch のサービス群 13 CloudWatch ダッシュボード CloudWatch メトリクス CloudWatch アラーム CloudWatch ネットワークモニタリング CloudWatch インフラストラクチャーインサイト CloudWatch APM CloudWatch Application Signals CloudWatch サービスレベル目標 CloudWatch Synthetics CloudWatch RUM CloudWatch ログ CloudWatch イベント CloudWatch Evidently

Slide 14

Slide 14 text

14 CloudWatch Application Signalsとは?

Slide 15

Slide 15 text

CloudWatch の APM ≒ Application Signals Amazon CloudWatch Application Signals(GA) CloudWatch Agent のデプロイできる、EKS, ECS, EC2 において、 X-Ray, ADOT の自動計装エージェントがアプリケーションを監視するソリューション ※APM は言語毎に実装が異なり、GA 直後の現在は Java, Python の対応 ● X-Ray 独自の利点(SQS, SNS, EventBridge etc のトレース)を保ちながら、OSS である OpenTelemetry の恩恵を受けれらる ● OpenTelemetry のエコシステムの拡大に合わせて、Application Signals も対応言語や 収集できるテレメトリを拡大できる ● Management Console 上では Application Signals の専用ビューが用意されており、 サービスやトポロジーを監視するための情報を可視化できる 15

Slide 16

Slide 16 text

Appendix: 手動計装と自動計装 手動計装(Manual instrumentation) アプリケーションコードに 手動でSDK/ライブラリ を組み込み、監視テレメトリデータを生成する 処理をコードに実装して、トレースを行う Goのコードへの実装例: 16 自動計装(Auto instrumentation) アプリケーションコードに変更を加えずに、 アプリケーション処理を動的にイジェクト(Java, Python)するツールを実装して、トレースを行う Java への実装例:.jar ファイル取得と-javaagent:引数の設定 import ( "os" "github.com/aws/aws-xray-sdk-go/awsplugins/ec2" "github.com/aws/aws-xray-sdk-go/xray" ) func init() { // conditionally load plugin if os.Getenv("ENVIRONMENT") == "production" { ec2.Init() } xray.Configure(xray.Config{ ServiceVersion: "1.2.3", }) } 引用「AWS X-Ray デベロッパーガイド」https://docs.aws.amazon.com/ja_jp/xray/latest/devguide/ $ wget \ https://github.com/aws/aws-xray-java-agent/releases/latest/ download/xray-agent.zip disco ├── disco-java-agent.jar └── disco-plugins ├── aws-xray-agent-plugin.jar ├── disco-java-agent-aws-plugin.jar ├── disco-java-agent-sql-plugin.jar └── disco-java-agent-web-plugin.jar

Slide 17

Slide 17 text

Application Signals のアーキテクチャ ● EC2 の場合は CW エージェントと別に、 ADOT などによるアプリケーションの 計装が必要 ● CW エージェントが Application Signals にトレース情報を書き込むために追加の IAM 権限が必要( application-signals:* ) 17 AWS Cloud Availability Zone 1 Virtual private cloud (VPC) Instance NAT gateway Instance with CloudWatch Endpoints Amazon CloudWatch    EC2 Instance CloudWatch エージェント ログファイル /var/log Java/Python アプリケーション ADOT

Slide 18

Slide 18 text

18 まとめ

Slide 19

Slide 19 text

まとめ ● CloudWatch Application Signals は CloudWatch が OpenTelemetry に対応し、 それぞれの利点を活かしシステムのオブザーバビリティを実現できるソリューション ● ECS, EKS, EC2 で利用できるが、ADOT による自動計装は Java, Python のみ ● OpenTelemetry を活用することで、その他のアプリケーションの APM ができる ● CloudWatch SLO や CloudWatch Observability EKS アドオンなど本日お話し できていないものも面白そう 19

Slide 20

Slide 20 text

Amazon CloudWatch Application Signals 徹底解説 20 Application Signals(Perview) 発表時のまとめです!本日のお話し振り返りでご覧ください!

Slide 21

Slide 21 text

Thank you