Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SREは、MCPとSRE Agentをこう使え!

SREは、MCPとSRE Agentをこう使え!

AWS Summit Japan 2026 NRUG SRE支部 出張版

AI x SRE で障害対応がどう変わるか? 現場目線でお話しします!
果たして、AIの力でオンコール対応時にお布団から出る回数が減らせるのか??

Avatar for kazumax55

kazumax55

June 25, 2026

More Decks by kazumax55

Other Decks in Programming

Transcript

  1. AWS Summit Japan 2026 出張 NRUG SRE 支 部 /

    New Relic Booth SREは、MCPと SRE Agentを こう使え! 小 原 一 真 株式会社ベガコーポレーション / SRE 兼 直営店システム部 部 長 @kazumax55 01 / 16 #NRUG_SRE
  2. A B O U T / N R U G

    S R E 支 部 “ぬるぐ” NRUG SRE 支 部 のあゆみ 2022.05 Vol.1 俺たちのSREとNew Relic 2022.10 Vol.2 俺たちのSREとNew Relic 〜ぶっちゃけSREって必要なの?編〜 2023.05 BOOK 書籍出版『俺たちのSREとNew Relic -書籍編-』 2023.06 Vol.3 俺たちのSREとNew Relic 〜俺たちがやりたかったO11y編〜 2023.09 番外編 FutureStack Tokyo — NRUG 2周年特別版 2026.02 Vol.4 はじめてのSLI/SLO設計ハンズオン 入門 編 02 / 16 #NRUG_SRE 2023.06 番外編 AWS Summit 2026 NRUG SREࢧ෦ ग़ுฤ
  3. SPEAKER 自 己 紹介 小 原 一 真 @kazumax55 株式会社ベガコーポレーション

    SRE 兼 直営店システム部 部 長 📍 東京 (リモート) > 本社は福岡 #SRE #New Relic #NRUG SRE 支 部 運営 著書 / 技術書典にて発売中 俺たちのSREとNew Relic -書籍編- ぜひチェックしてみてください! 家具インテリア D2C 事業 商品開発から販売まで 一 気通貫 2004 福岡にて創業 2006 自 社ECサイトOPEN 2022 実店舗展開開始 2026.06 現在 実店舗 16店舗展開 ↗︎ 今後も出店拡 大 中! 03 / 16 #NRUG_SRE
  4. A L E R T · S E V E

    R I T Y U N K N O W N 02:47 深夜、アラートが鳴る。 布団から起き上がり、調査がはじまる―― 01 アラートの内容を確認する 02 New Relic にログインして 関連エンティティを探る 03 原因 ・ 影響範囲を特定して トリアージ 04 Slackに報告して布団に戻る 調査結果: 一 時的な問題。サービス影響なし。 · そのあと:脳が覚醒、なかなか寝付けない…😳 この調査、最初からAIがやってくれたら… お布団から出る回数が減らせるのでは?? 04 / 16 #NRUG_SRE
  5. TODAY 今 日 話すこと 01 SREとは? 改めておさらい 02 MCPとは? AIとツールを繋ぐ仕組み

    03 New Relic MCPの使い 方 自 然 言 語で調査が 革 命的に楽になる 04 New Relic SRE Agentの使い 方 オンコールがちょっと楽になる 05 New Relic MCP × SRE Agent で変わったこと 現場の Before / After 06 AIの 力 でお布団から出る回数は減ったのか? オンコールはどこまで楽になった? 07 実践のコツ オブザーバビリティがAI活 用 の前提 05 / 16 #NRUG_SRE
  6. 01 SREとは? Site Reliability Engineering — ソフトウェアエンジニアリングの 手 法で、サービスの信頼性を継続的に 支

    える 人 SREの責務の 一 部 / 01 監視 ・ 観測 システムの可観測性を 高 める 問題の早期発 見 が信頼性の基盤 / 02 インシデント対応 障害時の迅速なトリアージ ダウンタイムを最 小 化する / 03 継続的改善 ポストモーテムの実施 効果的な再発防 止 策の検討 気合いではなく、仕組みで解決! 06 / 16 #NRUG_SRE
  7. 02 MCPとは? Model Context Protocol — AIとツールを繋ぐ標準プロトコル AI Claude 等

    MCP ▶︎ MCP Server ツール側が提供 API ▶︎ 外部ツール New Relic 等 AIが 自 然 言 語で外部ツールを操作できるようになる 各ツールが MCP Server を提供するだけでAIと繋げる ✓ New Relicも対応済み — 自 然 言 語でNew Relicを操作できる! 07 / 16 #NRUG_SRE
  8. 03 New Relic MCPの使い 方 自 然 言 語で、New Relicの調査が

    革 命的に楽になる B E F O R E 手 動でエンティティを渡り歩く × New Relicにログイン × 関連エンティティを探して開く × 各エンティティを渡り歩いて調査 × 色 々と知識が必要なこともある(NRQL等) × 時間がかかる! ▶︎ A F T E R 「過去1週間の問題を教えて」 ✓ 自 然 言 語で簡単に調査依頼 ✓ 複数エンティティを横断して調査 ✓ NRQLや深い知識がなくても 大 丈夫! 08 / 16 #NRUG_SRE
  9. 03 New Relic MCPの使い 方 実例 New Relic MCPサーバと接続したAIに、ざっくりした指 示

    を与えるだけで調査 ・ 分析を 自 動化できる New Relic MCPサーバと接続したAIに 「過去1週間の問題を教えて」 のようなざっくりとした指 示 を与え るだけで、専 門 知識がなくてもいい 感じにデータを集めて分析結果を報 告してくれる✨ P O I N T 1m33sで完了 調査 → 分析 → レポートまで 自 動実施 ⚡ 人 間業ではありえないスピード! 09 / 16 #NRUG_SRE
  10. 04 New Relic SRE Agentの使い 方 コンソールで直接質問も、アラートで 自 動調査も。SREもDevも、調査の負担から解放 チャット機能

    New Relicのコンソール上で直接、 自 然 言 語で質問できる。 MCPがチャットから使えるイメージ。 → この後 具体例ᶃ で実際の画 面 を紹介 アラート 自 動調査 アラートのNotify先に設定するだけ。 自 動で問題を調査し、レポートまで 自 動作成! → この後 具体例ᶄ で実際のレポートを紹介 step 01 アラート発 火 ▶︎ step 02 / AI SRE Agent が 自 動調査 ▶︎ step 03 調査結果レポート 10 / 16 #NRUG_SRE
  11. 04 New Relic SRE Agentの使い 方 実例1 AI環境がなくてもNew Relic Webコンソールから、AIに質問できる

    P O I N T ブラウザだけで完結!⚡ AI環境がなくても問い合わせ可能! 11 / 16 #NRUG_SRE
  12. 04 New Relic SRE Agentの使い 方 実例2 AlertのNotification先に設定すると、アラート発 生 時に

    自 動で調査を実施してくれる 自 動分析し結果報告 分析結果のサマリー エラーパターン集計 ・ 根本原因分析 関連アラート履歴調査 相関分析 推奨アクションの提 示 P O I N T 復旧時間を短縮 ࣗಈௐࠪ͞ΕΔ͜ͱʹΑΓ 何が起きたのか?からではなく この辺りが怪しいのか!から調査スタート ⚡ インシデント初動を 大 幅に 高 速化! 12 / 16 #NRUG_SRE
  13. 05 New Relic MCP × SRE Agent で変わったこと 現場の Before

    / After SRE 障害対応を 高 速に横断調査 B E F O R E APM → ログ → 別サービスを 手 動で渡り歩く 相関は 手 作業で組み 立 て(数 十 分かかることも) A F T E R 「障害の原因を調べて」 → 複数エンティティを横断し、ボトルネックを 自 動特定 横断調査を 自 動化し、調査時間を 大 幅短縮 割り込み対応が減り、信頼性改善に集中 Dev 開発者が 自 分で原因調査 B E F O R E Dev「このエラー何ですか?」→ SREにSlackで質問 SREが調査して回答(待ち時間が発 生 ) A F T E R 「エラーレートが上昇、原因は?」 → MCPやSRE Agentに直接問い合わせ、原因を特定 NRQL不要 ・自 然 言 語で、 自 分で原因に到達 SRE待ちゼロで開発を 止 めない 13 / 16 #NRUG_SRE ⚡ 専 門 知識(NRQL)不要 — 自 然 言 語で誰でも調査できる「調査の 民 主化」 SRE も Dev も、調査時間を 大 幅短縮して本来の仕事に集中できる! P O I N T
  14. 06 AIの 力 でお布団から出る回数は減ったのか? Q.オンコール時、お布団から出る回数は減らせる? A.惜しい…! 今はまだ減らせない ̋ PC なら

    Webコンソールに遷移すれば分析結果が 自 動表 示 ✗ スマホだと モバイルアプリが SRE Agent の分析結果表 示 に 非 対応 結局、PCを開くことに ⭐ 理想:オンコール調査が Slack だけで完結すれば、お布団から出ずに対応できる Slack通知 → SRE Agent が 自 動調査 → 結果をアラートのスレッドへ 自 動投稿 スマホでスレッドを 見 るだけで状況把握、 一 次対応まで完了 PCを開く必要がなくなり、「お布団から出る回数」が本当に減る ⚠ 注意:SRE Agent は Advanced CCU を消費します。アラートの閾値設計と合わせて、計画的な導 入 を。 14 / 16 #NRUG_SRE
  15. 07 実践のコツ MCPもSRE Agentも、データがあってこそ。 計測されたデータがないとAIには何も 見 えません。 APM パフォーマンス ・

    トレース Browser フロントエンド ・ UX可視化 Logs 全ログを 一 元集約 Mobile クラッシュ ・ レイテンシ Change Tracking デプロイ変更を記録 Alert 適切な閾値と通知設計 Service Levels SLO/SLIで可 用 性を管理 Errors Inbox エラーを 一 元トリアージ しっかり計装するほど、MCPの回答精度が上がり、SRE Agentの調査が深くなる。 まずオブザーバビリティを育てよう。 15 / 16 #NRUG_SRE ΦϒβʔόϏϦςΟΛҭͯΔ͜ͱ͕ɺAIΛ׆͔͢࠷େͷલఏ৚݅Ͱ͢ɻ
  16. SEE YOU NEXTNRUG_SRE!! NRUG Slack NRUG SRE 支 部 connpass

    俺たちのSREとNew Relic -書籍編- 16 / 16 #NRUG_SRE