Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS DevOps Agentで見えた運用の未来 / The Future of Oper...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
yayoi_dd
February 26, 2026
Technology
0
0
AWS DevOps Agentで見えた運用の未来 / The Future of Operations with AWS DevOps Agent
弥生株式会社 もくテク
AWS re:Invent 2025 参加報告会(2026/02/26)
https://mokuteku.connpass.com/event/383715/
yayoi_dd
February 26, 2026
Tweet
Share
More Decks by yayoi_dd
See All by yayoi_dd
AWS re:Invent 2025 参加報告 / AWS re:Invent 2025 Participation Report
yayoi_dd
0
0
re:Inventの学びを最大化するためにしたこと / What I Did to Maximize Learning at re:Invent
yayoi_dd
0
3
Werner Vogelsが語った”T型人材” / "T-Shaped Talent" as Discussed by Werner Vogels
yayoi_dd
0
0
AI駆動開発のさらにその先へ / Beyond AI-Driven Development
yayoi_dd
0
0
OpenSearch Warm Tier設計の実践 / Practical Implementation of OpenSearch Warm Tier Design
yayoi_dd
0
29
なぜ私たちは「生成AI-LT大会」を終了するのか / Why we are ending the Generative AI-LT competition
yayoi_dd
0
62
AIと働く / Working with AI
yayoi_dd
0
64
AIで未経験タスクの心理的ハードルが下がった話 / How AI has lowered the psychological barrier to unfamiliar tasks
yayoi_dd
0
41
品質くん~電話応対品質をAIで診断してる件~ / Quality-kun: Using AI to assess telephone response quality
yayoi_dd
0
40
Other Decks in Technology
See All in Technology
How to install a gem
indirect
0
1.7k
AWS Systems Managerのハイブリッドアクティベーションを使用したガバメントクラウド環境の統合管理
toru_kubota
1
180
PostgreSQL 18のNOT ENFORCEDな制約とDEFERRABLEの関係
yahonda
0
130
「お金で解決」が全てではない!大規模WebアプリのCI高速化 #phperkaigi
stefafafan
5
2.3k
The Rise of Browser Automation: AI-Powered Web Interaction in 2026
marcthompson_seo
0
310
Phase09_自動化_仕組み化
overflowinc
0
1.9k
Agent Skill 是什麼?對軟體產業帶來的變化
appleboy
0
240
【AWS】CloudTrail LakeとCloudWatch Logs Insightsの使い分け方針
tsurunosd
0
120
Bref でサービスを運用している話
sgash708
0
200
RGBに陥らないために -プロダクトの価値を届けるまで-
righttouch
PRO
0
120
Physical AI on AWS リファレンスアーキテクチャ / Physical AI on AWS Reference Architecture
aws_shota
1
170
TUNA Camp 2026 京都Stage ヒューリスティックアルゴリズム入門
terryu16
0
560
Featured
See All Featured
Discover your Explorer Soul
emna__ayadi
2
1.1k
Optimizing for Happiness
mojombo
378
71k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
53k
ラッコキーワード サービス紹介資料
rakko
1
2.8M
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
GraphQLとの向き合い方2022年版
quramy
50
14k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
210
AI: The stuff that nobody shows you
jnunemaker
PRO
3
490
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
140
So, you think you're a good person
axbom
PRO
2
2k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.4k
Transcript
弥生株式会社 NEXT BUクラウドプロダクト開発部 米川 桂 弥生株式会社 NEXT BUクラウドプロダクト開発部 米川 桂
弥生株式会社 / 米川 桂(よねかわ けい) 法人向け/個人事業主向けの会計ソフトの開発 C#/.NET/Azure/AWS re:Invent 2025に初現地参加 休日の過ごし方:テニス、子供と遊ぶ
None
アラーム疲れ: アラームのたびに一時的に開発 を止めて調査にあたるため、集中が削がれる 調査のボトルネック: アプリか?インフラか? あらゆるログを横断して調査 「AIが代わりに調べてくれたら⋯」 対応の遅れ: ユーザーへの問い合わせ対応、シ ステムの復旧までに遅れが生じる
None
自律的な原因分析と改善提案 経験豊富なDevOps エンジニアのように、リソース の関係性、オブザーバビリティツール、GitHubリ ポジトリ、CI/CD パイプラインから、テレメトリデ ータとコードを相互に関連付けて、インシデントの 根本原因分析や改善提案を自律的に行う。
「Agent Space」と呼ばれるワークスペースを作成 管理者向け 運用チーム向け マネジメントコンソールで「Agent Space」の作成、権 限付与、GitHub・NewRelic・Datadog等のサードパー ティ連携を設定を行う。 Agent Spaceを作成したら、専用のWebアプリが払い出
される。運用チームはこちらで日々のインシデントの 調査・対応を行う Agent Spaceとは: 「誰が(利用者)」「どの範囲(AWSアカウント・リソース)」を操作・調査できるかを定義する、安全な隔離環境 管理機能と日常の運用業務を分離するデュアルコンソールアーキテクチャを採用
プロンプト例: “Investigate the latest triggered CloudWatch alarm in ap-northeast- 1
for AWS account XXX. Analyze the underlying metrics and logs to identify the root cause.” AWSアカウント XXX の東京リージョンで発生した最新の CloudWatch ア ラームを調査し、関連するメトリクスとログを分析して根本原因を特定せ よ
None
アプリケーション: Lambda (コンテナイメージ) + DynamoDB CI/CDデプロイ: GitHub Actions で自動デプロイ 監視・アラーム通知:
CloudWatch Alarm + SNS + Q Developer (Chatbot) Slack連携
シナリオ: 仕様変更が入ったと仮定し、KeyError が発生するLambdaコードをデプロイ。リクエスト パラメータを変更せずに実行エラーを発生させ、アラーム状態に。
以前の正常なコンテナイメージのバー ジョンへのロールバックを具体的に提 案 「直前のデプロイがトリガーだと特定」 ・デプロイ履歴とエラー発生時間を照合 ・「直前の変更」が原因であることを突き 止めた ・調査時間は10分ほど
シナリオ: LambdaからDynamoDB への権限を剥奪 「AccessDenied を即座に検知・分析」 ・DynamoDBへの書き込み権限がないこと を正確に指摘 ・不足しているアクション( dynamodb:PutItem)を特定 ・修正用のIAMポリシー案まで提示
・調査時間は5分ほど
シナリオ: Lambdaのタイムアウトエラー シナリオ: DynamoDBスロットリングエラー 「設定値と実行実態の乖離を指摘」 ・マネコンからのタイムアウト設定 変更を検知 ・「現在のコードは完了までに3秒以 上必要」と分析 ・タイムアウト値を3秒以上に延⾧す
べき」と具体的な設定値を提案 ・調査時間は5分ほど 「キャパシティ不足をピンポイント に特定」 ・ログからスロットリングエラーの 発生を検知 ・書き込み容量(WCU)が「1」で 大幅に不足していると断定 ・調査時間は5分ほど
CloudWatchのアラームとDevOps Agentの調査結果を セットで通知することで、アラーム通知から原因究明 までシームレスな運用ができるのではと実感
リージョン制限: 現在はバージニア北部のみ。ターゲットのリソースは他リージョンでもOK 言語は英語のみ: プロンプトや出力は今のところすべて英語。ただし、翻訳ツールで十分実用レベル。 利用上限(月間クォータ): 調査20時間 / 予防分析10時間 / チャット1,000メッセージ
自動化は作り込みが必要: アラーム発報からの自動調査は標準機能としてはまだなく、CloudWatchアラームから Lambdaを経由してWebhookを叩く仕組みの構築が必要。 AgentSpace作成: 最大10個 同時実行数: インシデント解決調査タスク3つまで。インシデント予防評価タスクの数は1つまで 価格: プレビュー期間中は無料。※調査過程で実行されるAPI呼び出しやクエリには料金が発生
AIによる自律的な調査の実現 ログ解析やリソース確認をAIが自律的に実行し、人間が「何が起きたか」を探す時間はなく なるのでは MTTR(平均復旧時間)の大幅な短縮 原因特定だけでなく、具体的な修正案まで提示してくれるので、MTTR(平均復旧時間)の 大幅な短縮に繋がると実感 人間の役割の変化 監視から修復までがシームレスに繋がることで、人間は調査結果を確認し、影響範囲の把握 や「意思決定」に専念できる