Slide 1

Slide 1 text

2025/12/08 クラスメソッド re:Growth 2025 札幌 中川翔太 AWS DevOps Agent はオンコールエンジニアに代わるのか?

Slide 2

Slide 2 text

⾃⼰紹介 中川 翔太(Shota Nakagawa) クラスメソッド株式会社 クラウド事業本部コンサルティング部 ソリューションアーキテクト 仕事:AWS全般のお悩み相談 略歴:N/W製品ヘルプデスク→AWS運⽤→現職 趣味:道の駅巡り、キャンプ、ダーツ 現地不参加

Slide 3

Slide 3 text

AWS DevOps Agent

Slide 4

Slide 4 text

AWS DevOps Agent インシデントを⾃動調査し、根本原因分析と緩和策を提案してくれるサービス ● インシデント解決(⾃動調査) ○ アラートやサポートチケットを受けて⾃動で調査開始 ○ テレメトリ‧コード‧デプロイデータを相関分析 ● ツール連携 ○ 監視: CloudWatch, Dynatrace, Datadog, New Relic, Splunk ○ CI/CD: GitHub Actions, GitLab ○ 通知:Slack ○ チケットシステム: ServiceNow, PagerDuty ○ 拡張: MCP(Model Context Protocol)サーバー ● マルチアカウント‧マルチクラウド対応 ● us-east-1でプレビュー中(プレビュー中は無料) ○ us-east-1以外のリソースも調査可能、GA前に他リージョンへ拡⼤予定

Slide 5

Slide 5 text

あれ? 似たようなサービスがあったような...

Slide 6

Slide 6 text

CloudWatch Investigations(調査機能) Amazon Q Developer と連携してアラート調査するCloudWatchの機能

Slide 7

Slide 7 text

CloudWatch Investigations との違い AWS のサービス以外にも拡張されるのが⼤きな違い ● インシデント解決(⾃動調査) ○ アラートやサポートチケットを受けて⾃動で調査開始 ○ テレメトリ‧コード‧デプロイデータを相関分析 ○ 根本原因分析と緩和策の提案 ● ツール連携 ○ 監視: CloudWatch, Dynatrace, Datadog, New Relic, Splunk ○ CI/CD: GitHub Actions, GitLab ○ 通知:Slack ※SNSトピックスで統合可能 ○ チケットシステム: ServiceNow, PagerDuty ○ 拡張: MCP(Model Context Protocol)サーバー ● マルチアカウント‧マルチクラウド対応 ● us-east-1でプレビュー中(プレビュー中は無料) ○ us-east-1以外のリソースも調査可能、GA前に他リージョンへ拡⼤予定

Slide 8

Slide 8 text

豊富な外部連携 ※サービスによって双⽅向/単⽅向あり

Slide 9

Slide 9 text

No content

Slide 10

Slide 10 text

デモ⾵

Slide 11

Slide 11 text

デモ環境 毎分呼び出し ⼤量書き込み 調査 リポジトリ連携 通知 スロットリン グアラート キャパシティを削減

Slide 12

Slide 12 text

スペースを作成

Slide 13

Slide 13 text

スペース管理画⾯

Slide 14

Slide 14 text

Webアプリ画⾯

Slide 15

Slide 15 text

調査対象を⼊⼒

Slide 16

Slide 16 text

アラームからLambdaやDynamoDBを調査

Slide 17

Slide 17 text

GitHubのデプロイとエラーの相関を調査

Slide 18

Slide 18 text

CDKでキャパシティが削減されたことを特定!

Slide 19

Slide 19 text

根本原因と緩和計画の提案

Slide 20

Slide 20 text

推奨事項とアクションの承認

Slide 21

Slide 21 text

Slack にはスレッドが⽴てられ調査内容が送られている

Slide 22

Slide 22 text

(おまけ)CloudWatch Investigations でも調査 DynamoDBのキャパシティ不⾜は特定する。CDKの改善提案まではできない

Slide 23

Slide 23 text

まとめ

Slide 24

Slide 24 text

まとめ ● AWS DevOps Agent は インシデントを⾃動調査し、根本原因分析と緩和策を 提案するサービス ● アラートやサポートチケットをトリガーに、テレメトリ‧コード‧デプロイ データを相関分析 ● AWSサービス以外にも、Datadog、GitHub Actions、Slackなど豊富な外部 サービスと連携 ● CloudWatch Investigationsとの違いは、AWS外のサービスにも拡張されるの で、GitHub上のコード改善まで踏み込んで調査

Slide 25

Slide 25 text

AWS DevOps Agent はオンコールエンジニアに代わるのか? 半分YES、半分NO ● YES: 調査‧分析‧提案は任せられる ● NO: 最終判断と実⾏は⼈間 個⼈的には、深夜に起こされてもすでに調査が終わっているというは それだけで嬉しいと思いました!

Slide 26

Slide 26 text

参考URL

Slide 27

Slide 27 text

参考URL ● Frontier agent ‒ AWS DevOps Agent ‒ AWS ● What is AWS DevOps Agent ● AWS DevOps Agent helps you accelerate incident response and improve system reliability (preview) ● 【速報】新サービス AWS DevOps Agent の Preview での利⽤開始が発表されました#AWSreInvent ● AWS DevOps AgentがどこまでCDKの設定ミスを特定してくれるのか試してみた #AWSreInvent ● 【レポート】 AWS DevOps Agentでクラウド運⽤を変⾰「Move beyond reactive: Transform cloud ops with AWS DevOps Agent」に参加しました! ● AWS DevOps Agent(Preview)の Datadog MCP サーバ連携をやってみた #AWSreInvent ● AWS DevOps Agent (Preview)のPagerDuty連携とWebhook設定をやってみようとした #AWSreInvent ● AWS DevOps Agent (Preview)のSlack連携をやってみた #AWSreInvent ● AWS DevOps Agent で Datadog アラートをトリガーにした⾃動インシデント調査をやってみた #AWSreInvent ● AWS DevOps Agent (Preview)のマルチアカウントアクセスをやってみた #AWSreInvent

Slide 28

Slide 28 text

No content