Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
opsmethod第1回_アラート調査の自動化にむけて
Search
OKU/YAMATO
February 23, 2026
Technology
580
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
opsmethod第1回_アラート調査の自動化にむけて
2026年2月13日(金)に開催されたopsmethodの登壇資料
OKU/YAMATO
February 23, 2026
More Decks by OKU/YAMATO
See All by OKU/YAMATO
DevelopersIO2025Osaka_システムの運用監視の効率をAIを使って上げる
yamatook
2
1k
Other Decks in Technology
See All in Technology
Android の公式 Skill / Android skills
yanzm
0
160
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
140
Lightning近況報告
kozy4324
0
180
気軽に使える"情報のハブ"としてのNotion活用 〜フロー情報の集積点 と、 Claude Code × Notion AI〜
syucream
1
150
[チョークトーク資料]AWS DevOps Agent を使いこなす / AWS Dev Ops Agent Chalk Talk AWS Summit Japan 2026
kinunori
2
520
AIAU_UMEMOGU_ninomiya_slide
ninomiya_ii
0
230
When Platform Engineering Meets GenAI
sucitw
0
120
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
160
RAG を使わないという選択肢
tatsutaka
1
270
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
270
20260619 私の日常業務での生成 AI 活用
masaruogura
1
230
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
1.3k
Featured
See All Featured
HTML-Aware ERB: The Path to Reactive Rendering @ RubyCon 2026, Rimini, Italy
marcoroth
1
200
Fireside Chat
paigeccino
42
4k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
Raft: Consensus for Rubyists
vanstee
141
7.5k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
210
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
430
Tell your own story through comics
letsgokoyo
1
960
Accessibility Awareness
sabderemane
1
140
Transcript
アラート調査の⾃動化にむけて ~ システム異常の調査を⾃動化した知⾒を共有したい ~ クラスメソッドオペレーションズ株式会社 クラウド運⽤チーム 奥井 ⼤和
Name → 奥井 大和 ( Okui Yamato ) 所属: クラスメソッド
オペレーションズ株式会社 クラウド運用チーム 主な業務: お客様のAWS環境の運用・保守 日々のアラート対応と障害調査 最近買って良かったもの: パネルヒーター 足元を温めてQOLの向上 自己紹介
本日のアジェンダ 1 定義:アラート調査の自動化とは 2 プロセス: どこから自動化するか? 3 アプローチ: やってみた結果
「アラート調査の自動化」とは? システム異常の通知を受け、その根本原因を特 定する作業 調査・判断をAIに任せる 「調査の初動と情報収集」を 爆速に効率化したい :アラート調査 :自動化の目標 調査の図
スコープ: 原因特定の効率化 STEP 1 監視ツールが異常検知 STEP 2 アラート通知 (メールやSlack等) STEP
3 調査 (ここを自動化したい) STEP 4 改善対応 (修復や予防などのアクション) 本件で目指すところ アラート起点の調査の STEP
"毎回似たプロセスで調査していないか? 対象環境やリソースが違うだけで、 やることは同じなのでは?" 仮説:調査のアクションをロジックは共通 「何をしたいか」さえ明確に指示すれば、 AIに任せられる。 なぜ自動化しようと思ったか、経緯
調査のプロセスを分解してみる 調査対象は違っても、やることは定型的 結果の記録・次のアクション 1 最初の状況確認と判断 (サービス停止?影響範囲?) 2 対象の特定 (ID確認、構成把握) 3
情報収集 (メトリクス、ログ、CloudTrail) 4 分析・原因の切り分け (しきい値判定、相関分析) 5 関連する影響の確認 (同システムの他サービスへの波及) 6 STEP 3 今日は トリアージ と呼ばせて
通知から全自動 通知 ➡ [AIが調査・分析・報告 ] ➡ 完了 トリアージの 後から自動 通知
➡ [人間が判断 ] ➡ [AIが調査 開始] ➡ 完了 部分的にAI利用 [人間] ➡ [AIでログ要約 ] ➡ [人間] ➡ ... 自動化の起点はどこにする? A B C 主要な3パターン
👉 全自動が正解とは限らない。目的に合わせて選択する。 項目 A: 全自動 B: トリアージ後 C: 部分的 速度
最速 数分のロス 遅い 精度 誤検知リスク 人間が要否判断 都度判断 導入コスト 高い (構築など) 中程度 低い 環境影響 システム変更あり 最小限 なし 各パターンの比較
私は「B: トリアージ後から自動」を選択 理由:最適なバランス 「サービスが止まっているか」「ユーザー影響はあるか」の重大な判断は人間が担いたい 対象さえ特定できれば、その後の情報収集や分析はロジックで回せる 既存のAWS環境にAIエージェント等の追加コンポーネントを導入せず、 今ある権限内で完結でき、環境に依存しない
✅ :既存環境に変更ゼロ / ReadOnlyで安全 実装構成 1. 人間: アラート情報をプロンプトに貼る 2. Claude
Code: 自動調査を開始 (アカウントのIAMには読み取り権限を 許可) 3. フォールバック: 権限不足時は 「追加調査手順書」 を生成 • リソース特定・メトリクス取得 • ログ分析・相関関係チェック • レポート生成
実際の調査フロー テキストファイル & 対話ベースの指示 1. プロンプトやファイルの準備 アラート通知内容をファイルにペースト 2. Claude Code
実行 ターミナルで調査開始コマンドを実行 AIが `aws cloudwatch ...` 等をCLIを自律的に実行し情報を収集 3. 成果物の生成 調査結果をまとめたレポートが出力される AWSのMCPの活用により、エビデンスも自動で取得
導入成果 以前の調査時間 導入後の調査時間 1日 所要時間 1時間 調査範囲 属人的 網羅的で高パフォーマンス
向き合い方 新たな課題と向き合い方 AI は「優秀な相方」として扱う 権限のトレードオフ 精度の限界 設定コスト IAMは読み取り権限に 絞っているため AI
だけで 完結しない。 セキュリティとのバランスとして 割り切る。 仮説が的外れなこともある。 手放しにせず、 人間がコンソールで 裏取り確認を行う。 プロンプトや機能の 定義に工数がかかる。 しかしプロセス言語化の 投資対効果は高い。 課題
まとめ:調査の自動化を実現するポイント プロセスの分解 調査は定型的。 プロセスを言語化する! 起点を選ぶ 全自動にこだわらず 目的に合わせて、どこから AIに任せるか決める 小さく始める 目星がつくだけで
調査は速くなり 効率化できる!
ご清聴ありがとうございました https://dev.classmethod.jp/author/okui-yamato/