AI時代のインシデント対応〜時代を切り抜ける、組織アーキテクチャ〜

時代を切り抜ける、組織アーキテクチャ AI 時代のインシデント対応

Kazuto Kusama @jacopen Product Evangelist @PagerDuty Japan Organizer @Platform Engineering
Meetup Founder @Cloud Native Innovators Association アーキテクチャConference登壇時に口頭で補足した内容を、ここの枠に書いていきます

2025年 AIエージェント元年 xx元年っていうの、だいたい眉唾なんですがコレに関しては間違いなくその通りと言えますね。この 1年でめちゃくちゃ変わりました。自分もあらゆる用途に活用しています

「AIでなんとかしよう」その発想が、組織を壊すかもしれない今日のテーマでも、本セッションではあえてこういうテーマでお話をします。

アプリケーション開発の高速化 AIエージェントがコーディング作業の大半を代行してくれることにより、アプリケーション開発が格段に高速化。 ⇨ 生み出されるアプリケーションの数が増大する AIコーディングエージェントにより開発は大きく変わりましたね。ほんの1年前までは人間が主でAIが補佐でしたが、今ではAIが主で人間が指示役
開発はスピードアップし、生まれるアプリが増えます

少数精鋭のチーム構成にアプリケーション開発に必要な人数が減少、少数精鋭によるチーム構成にこれまでは7〜8人程度のチームで開発に当たるのが最も効率が良いとされてきた (Two-pizza rule) AIエージェントがコーディングを担うことで、AI に適切な指示を下せる2, 3人のチームになっ
ていく可能性 ⇨ 多数のチームに分割され、多くのアプリケーションが開発されるようになるこういう組織も出ているようです。人材育成などの課題はあれど、アウトプットを最大化するなら熟練エンジニアがAIしばきまくったほうが速い

アプリケーション開発の民主化知識を持つ人に限られていたアプリケーション開発ノーコード・ローコードツールも多数存在したが、ツールの枠は超えられず、自由度は低かった。 AIエージェントによって、作りたいものの概要を伝えるだけで、自律的に開発が進むように。 ⇨
アプリケーションの作り手が非エンジニアまで拡大するたとえばプロダクトマネージャーのような役割の人も、 AIを活用して開発に参加したり、プロトタイプを自身で開発したりというケースが増えてきていますね。

全体的には、すごく良いことしかし・・・

障害のほとんどはデプロイによって引き起こされる “障害のほとんどはデプロイによって引き起こされる。したがって、デプロイが増えると障害も増え、結果としてインシデント管理、軽減策、ポストモーテムが必要となる” エレガントパズル　エンジニアのマネジメントという難問にあなたはどう立ち向かうのかより引用 https://www.amazon.co.jp/dp/4296070916 ⇨ 開発が高速化するとデプロイも増え、インシデントが増える
障害のうち、インフラやクラウドによるものって実は少ないんですよね。多くは「何か変更を加えたとき」に起きます。なので、アプリのデプロイ回数増えたら比例してインシデントは増えます。

複雑性の増加少数精鋭のチームによって生み出されたサービスは、それぞれがAPI等で連携する。いわゆるマイクロサービスアーキテクチャスケーラブルなアプリケーションにするためには重要なことだが、複雑性が増しインシデントが増える関係ないですがマイクロサービスを実践できてる組織、日本全体の何割なんだろう？
正直ちゃんと運用出来る組織、ごく僅かでは

人の目を通さないコードの増加エンジニア、非エンジニアどちらにおいても、人の目を通さないコードが増加する。専門的知識が無くても開発出来る時代だが、必ずしもセキュアで、スケーラビリティが担保され、バグのないコードとは限らない専門知識を持った人の目を通さないコードがデプロイされることで、予期せぬ障害やセキュリティ侵害が起きてインシデントになるほんとはちゃんとレビューしないといけないんですが、
ついついラクをしてちゃんと見ずにマージ、してませんか？僕はたまにしてます。でも、それが事故に繋がる。

つまり、AIエージェント時代になるとインシデントが増える！

システム障害事例 2025年7月に発生。 AIコーディングツール Replitで起きたインシデント。 AIが開発者の命令を無視して本番環境のデータベースを削除。さらに4,000人分の架空ユーザーと虚偽のデータを生成して隠蔽を図った。 https://rocket-boys.co.jp/security-measu res-lab/chatgpt-replit-ai-coding-tool-del
etes-production-database-serious-incid ent-behind-vibe-coding/

セキュリティインシデント事例女性向けデートセーフティアプリ「Tea」で発生した大規模なデータ漏洩。 2025年7月25日に、データストレージシステムが侵害され、約72,000枚の画像（13,000枚のセルフィーと身分証明書、59,000枚のユーザー投稿画像）が流出。 • Firebaseデータストアが認証無しで公開状態 • Vibe
codingが原因とされる。非エンジニアの開発者がAIツールに依存して生成したコードを利用 • 2024年2月以前のバケットが不適切な状態

ではどうするか Proprietary & Conﬁdential アプリケーションの数を制限高速開発を諦めて従来の方法に戻す非エンジニアによる開発を辞めさせる
じゃあAIやめますか。

ではどうするか Proprietary & Conﬁdential アプリケーションの数を制限高速開発を諦めて従来の方法に戻す非エンジニアによる開発を辞めさせる
それは違う

AIエージェントによる恩恵は最大限受けるべきではどうするか

インシデント起きたとしても AIで対処すればいいのでは？こういう考えに至る人もいるんじゃないでしょうか。

インシデントも AIで対処すればいいなんて考えは甘え

インシデントも AIで対処すればいいなんて考えは甘え PagerDutyも「AIエージェントで運用が良くなる！」という機能を前面に押し出してるので、これ言うと営業からやめてくれと言われそう。でも、やっぱ甘えだと思うんです。

インシデント対応もアーキテクチャが全て AIより先に「構造設計」

「システム障害で混乱がおきるので、AIで何とかしよう」 (インシデントの元となる) システム障害が起きると社内に混乱が起きるから、それを防ぐ為に AIを活用したい。＝技術的な問題だから、技術で対応しようとしている CIO 一体
どうなってるんだ! 現状を教えてください！今何が起きてるの！スココンスココンアラート動かない！ユーザー担当別チームユーザーシステム障害で社内に混乱が起きている様子

混乱が続くとどうなるか

「システム障害で混乱がおきるので、AIで何とかしよう」 (インシデントの元となる) システム障害が起きると社内に混乱が起きるから、それを防ぐ為に AIを活用したい＝技術的な問題だから、技術で対応しようとしている CIO 一体
どうなってるんだ! 現状を教えてください！今何が起きてるの！スココンスココンアラート動かない！ユーザー担当別チームユーザーシステム障害で社内に混乱が起きている様子混乱を起こしているのは誰？確かにシステム障害がキッカケになっていますが、混乱を引き起こしているのは誰なんでしょう。そう、混乱を起こしているのは人間なんですよね

障害は技術的に、混乱は構造的に生まれる • 技術的な障害（Failure）はシステムの設計不備や未知の条件から発生する。 • しかし“混乱”（Chaos）は、情報の流れ・意思決定の経路・責任の所在が曖昧な組織アーキテクチャから生じる
。 • つまり障害そのものよりも対応中の構造が組織全体を危機に陥れる。 CIO 一体どうなってるんだ! 現状を教えてください！今何が起きてるの！スココンスココンアラート動かない！ユーザー担当別チームユーザー障害 = 技術の問題混乱 = 組織アーキテクチャの問題

障害は技術的に、混乱は構造的に生まれる • 技術的な障害（Failure）はシステムの設計不備や未知の条件から発生する。 • しかし“混乱”（Chaos）は、情報の流れ・意思決定の経路
・責任の所在が曖昧な組織アーキテクチャから生じる。 • つまり障害そのものよりも対応中の構造が組織全体を危機に陥れる。 CIO 一体どうなってるんだ! 現状を教えてください！今何が起きてるの！スココンスココンアラート動かない！ユーザー担当別チームユーザー障害 = 技術の問題混乱 = 組織アーキテクチャの問題

先人から学ぶ災害対応の現場において • 人命や財産に重大な危機 • パニックになる住民 • 多くの関係者(行政、消防、救急、警察) • 多くの情報発信手段(防災無線、マスコミ、自治
体の掲示板etc) これらを適切に制御し、市民の安全を守らなければいけない https://commons.wikimedia.org/wiki/File:%E5%AE%B6%E5%B1%8B%E7%81%AB%E7%81%BDP6014960.jpg この混乱への対処方法は、先人に学ぶのが良いでしょう。インシデント対応については、災害対応が先行してきました。

Incident Command System (ICS) • 1970年代に米国の消防によって確立された、災害対応時に統制を取るための方法論 • 米国は山火事が多く発生する地域。ひとたび発生すると大きな影響が及ぶため、行政や報道機関と連携して対応していく必要性がうまれた
• 標準化された組織構造、統一された指揮 • スパンオブコントロール • 柔軟性と拡張性 • 機能別の部門編成 • インシデントアクションプラン（IAP） • リソース管理 • 安全管理 • 文書化と記録災害対応から生まれたICSは、ITシステムの運用においても取り入れられつつあります。

ICSを取り込む考え方 — 組織を “分散システム ” と捉え、設計する分散システムの文脈だと･･･ CAP定理 • 一貫性（Consistency）
• 可用性（Availability） • 分断耐性（Partition Tolerance）実装・設計の観点 • 障害検知とリカバリ機構 • 同期戦略 • 分散トランザクション • リーダー選出組織アーキテクチャにこの考えを直接適用することはできないが、思考のフレームワークとしては有用アーキテクチャConferenceの参加者向けに表現したものがこれです。組織はナマモノなので、分散システムの考え方がそのまま使えるわけではないですが、思考のフレームワークとして取り入れるのはどうでしょう

ICSを取り込む考え方 — 組織を “分散システム ” と捉え、設計する責任の所在と意思決定の経路を明確にし
情報の流れをコントロールする =一貫性の担保インシデントコマンダー (IC)を中心とした命令指揮系統を構築 ICはインシデント対応の指揮者。重大インシデントを解決に導くことを目的とし、意思決定を行う。インシデントコマンダー作業担当 CIO ユーザー担当別チームユーザー

平時(peacetime)と戦時(wartime)を分離インシデントコマンダー作業担当 CIO ユーザー担当別チームユーザー平時は「ビジネスを回すこと」が最重要。戦時は「インシデントの解決」が最重要。目的が異なるので、区別して組織構造を作る必要がある
平時: 社長が一番偉い戦時: ICが最も位が高い (インシデント解決の文脈において)

リーダー選出最初に到着した人がインシデントコマンダー分散システムにおいてリーダー選出は重要人命に影響する災害対応においては、最初に現場に到着した者がインシデントコマンダーとなるのがセオリー。その後より適した者がきたら、インシデントコマンダーを明示的に移譲する。 ITシステムの場合はその限りではない。同様に先着で決めても良いし、ローテーションでも良い。大事なのは、組織内でき
ちんとルールを決めておくこと。また、なるべく役割を固定化しないこと。より適した人が来たら委譲しても良い。その場合、移譲する旨を全体に宣言することが大事これよりICをXXさんに移譲します

コントロールプレーンとデータプレーンを分離インシデントコマンダーコントロールプレーン: ICを中心とした、意思決定と指揮を行う密な連携レスポンダー書記リエゾンデータプレーン: ステークホルダーとのコミュニケーションパス
CIO Dev Support Sales コミュニケーション超大事。でも、あるべきコミュニケーションの形は、相手によって変わります。インシデントに直接対応する人たちと、ステークホルダーは分けて考えなくてはいけません。

コントロールプレーン内のコミュニケーションインシデントコマンダーレスポンダー書記リエゾン War Room 重大インシデント発生時に、集中的に問題解決にあたる専用の対応拠点物理的な会議室
もしくはバーチャル (Zoom, Teams等) リアルタイムで一元的なコミュニケーションにより、迅速な意思決定と集中的な問題解決を可能にする

データプレーンのコミュニケーション経営的な意思決定、対外的な情報発信のために重要。3つの「適切」を意識 • 適切な粒度 • 技術的な詳細までは不要 • 何が起きているか、今何をしているか
、今後の見通し　を伝える • 適切な方法 • ブロードキャスト型を徹底 • 戦時における1:1のコミュニケーションは、取り返しの付かない遅延を招く • 適切なタイミング • 定期的 (1時間おき、など) • ステータスに変化があったとき CIO Dev Support Sales

改善のためのフィードバック起きてしまったインシデントは、きちんと振り返って改善に繋げる AIエージェントによる問題？人為的なミス？インフラの障害？障害によって対処すべき方法が異なる。きちんと振り返り「インシデントが繰り返し起きないよう対処」することが重要いわゆる「ポストモーテム」「ポストインシデントレ
ビュー」と呼ばれる取り組みですね。これが本当に大事

もっと人間的な要素に注目する現代のシステムは、人間が人間の目的のために構築したもの。なので、人間的な要素を理解しなければ、技術的な要素を理解することはできない有意義なポストインシデントレビューを行うには、直面した技術的な課題とそれを処理した組織アーキテクチャの両方を考慮する技術面におけるポストインシデントレビューをやってい
る人は多いと思うんですが、混乱を起こすのが「人」であると考えると、人間的な要素まで踏み込んで振り返ってみましょう

例クレームがきてます確かに何かおかしい DBへのクエリが通らない Xさんを呼ぼうメタデータロッ
クだねリリースプロセス見直す調査開始復旧対応シナリオ: 障害によりユーザーからクレーム。最初に対応したエンジニアは、ログやメトリクスを見て「何かがおかしい」と感じました。調査を進めると、どうやら DBがおかしいようです。そこで、DBAであるXさんを呼ぶことにしました。 Xさんはメタデータロックによるロック解放待ちが原因になっていることを突き止め、対処を行い問題は解消しました。リリース時の ALTER TABLEが原因となったため、ポストインシデントレビューを通じてリリースプロセスを見直すことにしました。

インタビュー『なぜあのとき Xさんを呼びましたか？』組織を跨いだ連携があった場合も、インタビューの余地がある “DBに関する問題だと報告を受けた時点で、真っ先に思い浮かんだのが Xさんだった。XさんはDBエンジニアとして豊富な経験を積んでいるし、過去にも似たようなトラブルで対応してもらったことがあった。Yさんも同様に経験豊富だが、 Xさんに比べるとレスポンスが遅いことがあり、今回のような緊急事態であればまずXさんに聞くのが良いと思った”
ここで、「人間的な要素」に踏み込んだポストインシデントレビューのために、インタビューを行ってみましょう。なぜあのとき、無意識にXさんを呼ぼうとなったのでしょう。

インタビュー『なぜあのとき Xさんを呼びましたか？』 • 組織を跨いでいるにも関わらず、Xさんを呼べばいいとすぐに思いついた & すぐに連絡が付いた　ということは良いこと • 上手くいっていない組織だとこれすら難しい • これをより広く共有できれば、さらなる学びに繋がる
• 一方で、今後もXさんに依存してしまうのはリスク • DBエンジニアへのエスカレーションプロセスを確立する必要があるかも • 経験がまだ浅いエンジニアをどのように巻き込んでいくかこのXさんを呼んだ流れ、良いことと言えるんですよね。 DBの問題はこの人に聞けば良いという知識が組織にあるからこそ、これができた。上手くいっていない組織はこれすらできない。良いところもしっかり理解し、維持していきましょう。改善点があるとすると、Xさんが単一障害点になり得るという点でしょうか。ここは、DBA側で組織的に対応できるようにフォーメーションを組むのが改善策になりそうです。

開発・運用に分ける考え方の限界 AIエージェント時代では、開発と運用に役割を分けること自体が困難になる。アプリが障害を起こしたとき、運用の人に対して「AIが書いたコードだから仕方ないね」と言ったらどう思うかそもそもたくさんのアプリを運用チームが面倒見るのは困難だし、対応が難しいあと、DevとOpsに分ける考え方。これそろそろ限界だと思うんですよね。DevOpsという考え方もありますが、
そもそも役割分かれてると辛くない？

フルサービスオーナーシップの適用「コードを書いた者が、その責任を負う」設計と実装の点から見て、テクノロジーに最も精通した人が製品開発ライフサイクル全体の責任を引き受ける運用モデル本番環境において自分が書いたコードの責任を負うよう、最もシンプルな形でエンジニアに権限を与える Build Test
Ship Run You build it, you run it. PagerDutyでは、これをフルサービスオーナーシップと呼んでいます。他にもフルサイクルデベロッパーとか、各社いろんな呼び方があります

「開発者に運用もやらせる」ではなく「ライフサイクルに責任を持たせる」 Build Test Ship Run スケールアウトがしやすい実装 (コンテナオーケストレーターの自律復旧に委ねる) ビルドやパッケージングの自
動化素早いビルドの工夫実行パラメータの外部注入(環境依存の排除) トラブルシュートしやすいログの工夫インフラのコード化フィードバックループで改善を続け、呼び出しの頻度を減らす

AIが得意なことアラートの分類・関連付け・初動判断 Runbook自動実行、メッセージ生成 Postmortem分析支援 AIが不得意なことどのチームが対応するべきか、誰が指揮を取るかの判断状況判断、優先順位の決定、責任分離組織の学習構造の設計

構造設計をせず、安易な AI活用によって起こる弊害 AIが「これは重大です」といっても、誰が判断するのか不明確。また、情報洪水が発生。AIアラート関連付けや要約がない場合の改善を期待して導入したはずが、構造がないと逆にAIが大量の“半自動メッセージ ”を発生させる。 CIO
一体どうなってるんだ! 現状を教えてください！今何が起きてるの！スココンスココンアラート動かない！ユーザー担当別チームユーザーヤバい！重大！情報情報情報

構造設計をせず、安易な AI活用によって起こる弊害平時の組織体制のままで運用にAIを取り込んでも、緊急時の素早い対応は難しい。ヤバい！重大！情報情報情報本来情報を届けるべき人目的が「ビジネスを回すこと」となっている平時の体制でAIを入れたところで、命令指揮系統が対応しておら
ず機能しない

構造設計をせず、安易な AI活用によって起こる弊害システム運用には、必ず「責任」が伴う。 AIに大いなる力を持たせることは可能だが、大いなる責任は引き受けてくれないあなたはシステム管理者から通常の講習を受けたはずです。これは通常、以下の3点に要約されます: #1) 他人のプライバシーを尊重すること。 #2)
タイプする前に考えること。 #3) 大いなる力には大いなる責任が伴うこと。今現在のAIは、考えるより先にタイプする (実行する) 感がある AIにシステム運用させるには大いなる力も必要しかし責任は取ってくれない

はインシデントに強い組織アーキテクチャを実現するためにキーとなる能力をもたらすサービスです。情報の流れ・意思決定の経路・責任の所在をクリアにし、インシデントによる混乱を最低限に抑えます。
発生する大量の情報を整理し最適な人に通知 War Room自動作成意思決定に役立つインサイトの提供

はインシデントに強い組織アーキテクチャを実現するためにキーとなる能力をもたらすサービスです。情報の流れ・意思決定の経路・責任の所在をクリアにし、インシデントによる混乱を最低限に抑えます。
ブロードキャスト型のステータス共有組織アーキテクチャに踏み込むポストインシデントレビューフルサービスオーナーシップを実現

は情報の流れ・意思決定の経路・責任の所在をクリアにする ↑はオブザーバビリティツールだけでは実現が困難。 ITSMツールだけでも難しい。 PagerDutyはそれに特化した、希有なサービス障害が起きたときに担当者を電話で叩き起こすサービス･･･と思われがちですが、それは情報の流れ
をコントロールする機能の一部に過ぎないのです

インシデント対応もアーキテクチャが全て AIより先に「構造設計」まとめ

補足 PagerDutyは決してAIを否定しているわけでなく、むしろ「AIファースト」を謳うなどインシデント管理のAI活用に極めて積極的なサービスです。他社に数年先行して、AIOpsをサービス化しています。インシデント管理のパイオニア、かつAIに長く取り組んでいるからこそ「組織アーキテクチャが大事」と自信を持って言えると考えています。

PagerDuty AI エージェント - インサイトからアクションまで - エージェントがより良く、早く、スマートに業務を⽀援 SRE エージェント運⽤上の問題を特定して
分類し、関連する過去のインシデントなどの重要なコンテキストを浮き彫りにし、対応者に解決を早めるための推奨事項を提⽰することにより、業務の中断によって引き起こされるビジネスリスクを軽減し、顧客体験を向上 Insight エージェント組織内で使われているツール全体のデータを分析し、戦略的な運⽤判断に必要な情報を特定し、運⽤⼿順とビジネスの効率を継続的に改善 Shift エージェントオンコールシフトを動的に調整して、スケジュールや空き時間の競合を未然に防ぎ、インシデント担当者のカバレッジを確保することで、迅速なインシデント解決を促進し、運⽤コストの削減と顧客影響の最⼩化を図る Scribe エージェント Web 会議での会話内容をリアルタイムに整理、分析し、必要なアクションを特定し、内容をサマリーして提供することにより、インシデント解決の迅速化と関係者への情報共有を促進インシデント対応プロセスの改善 On-call 対応スケジュールの調整インシデント対応中の右腕役インシデント対応の筆記担当者

こちらに興味がある方は是非 PagerDutyウェブサイト、もしくはお問い合わせください

AI時代のインシデント対応〜時代を切り抜ける、組織アーキテクチャ〜

AI時代のインシデント対応〜時代を切り抜ける、組織アーキテクチャ〜

Kazuto Kusama

More Decks by Kazuto Kusama

Other Decks in Technology

Featured

Transcript

時代を切り抜ける、組織アーキテクチャ AI 時代のインシデント対応

Kazuto Kusama @jacopen Product Evangelist @PagerDuty Japan Organizer @Platform Engineering

2025年 AIエージェント元年 xx元年っていうの、だいたい眉唾なんですがコレに関しては間違いなくその通りと言えますね。この 1年でめちゃくちゃ変わりました。自分もあらゆる用途に活用しています

「AIでなんとかしよう」その発想が、組織を壊すかもしれない今日のテーマでも、本セッションではあえてこういうテーマでお話をします。

全体的には、すごく良いことしかし・・・

つまり、AIエージェント時代になるとインシデントが増える！

ではどうするか Proprietary & Conﬁdential アプリケーションの数を制限高速開発を諦めて従来の方法に戻す非エンジニアによる開発を辞めさせる

ではどうするか Proprietary & Conﬁdential アプリケーションの数を制限高速開発を諦めて従来の方法に戻す非エンジニアによる開発を辞めさせる

AIエージェントによる恩恵は最大限受けるべきではどうするか

インシデント起きたとしても AIで対処すればいいのでは？こういう考えに至る人もいるんじゃないでしょうか。

インシデントも AIで対処すればいいなんて考えは甘え

インシデント対応もアーキテクチャが全て AIより先に「構造設計」

混乱が続くとどうなるか

障害は技術的に、混乱は構造的に生まれる • 技術的な障害（Failure）はシステムの設計不備や未知の条件から発生する。 • しかし“混乱”（Chaos）は、情報の流れ・意思決定の経路

先人から学ぶ災害対応の現場において • 人命や財産に重大な危機 • パニックになる住民 • 多くの関係者(行政、消防、救急、警察) • 多くの情報発信手段(防災無線、マスコミ、自治

ICSを取り込む考え方 — 組織を “分散システム ” と捉え、設計する分散システムの文脈だと･･･ CAP定理 • 一貫性（Consistency）

ICSを取り込む考え方 — 組織を “分散システム ” と捉え、設計する責任の所在と意思決定の経路を明確にし

コントロールプレーン内のコミュニケーションインシデントコマンダーレスポンダー書記リエゾン War Room 重大インシデント発生時に、集中的に問題解決にあたる専用の対応拠点物理的な会議室

データプレーンのコミュニケーション経営的な意思決定、対外的な情報発信のために重要。3つの「適切」を意識 • 適切な粒度 • 技術的な詳細までは不要 • 何が起きているか、今何をしているか

例クレームがきてます確かに何かおかしい DBへのクエリが通らない Xさんを呼ぼうメタデータロッ

「開発者に運用もやらせる」ではなく「ライフサイクルに責任を持たせる」 Build Test Ship Run スケールアウトがしやすい実装 (コンテナオーケストレーターの自律復旧に委ねる) ビルドやパッケージングの自

はインシデントに強い組織アーキテクチャを実現するためにキーとなる能力をもたらすサービスです。情報の流れ・意思決定の経路・責任の所在をクリアにし、インシデントによる混乱を最低限に抑えます。

はインシデントに強い組織アーキテクチャを実現するためにキーとなる能力をもたらすサービスです。情報の流れ・意思決定の経路・責任の所在をクリアにし、インシデントによる混乱を最低限に抑えます。

インシデント対応もアーキテクチャが全て AIより先に「構造設計」まとめ

PagerDuty AI エージェント - インサイトからアクションまで - エージェントがより良く、早く、スマートに業務を⽀援 SRE エージェント運⽤上の問題を特定して

こちらに興味がある方は是非 PagerDutyウェブサイト、もしくはお問い合わせください

AI時代のインシデント対応 〜時代を切り抜ける、組織アーキテクチャ〜

AI時代のインシデント対応 〜時代を切り抜ける、組織アーキテクチャ〜

More Decks by Kazuto Kusama

Other Decks in Technology

Featured

Transcript

AI時代のインシデント対応〜時代を切り抜ける、組織アーキテクチャ〜

AI時代のインシデント対応〜時代を切り抜ける、組織アーキテクチャ〜