NewRelic MCPを活用して、APM監視から改善計画立てるまでの工数がゼロになった話 by エアークローゼット辻亮佑さん

NewRelic MCPを活用して APM監視から改善計画まで工数がゼロになった話 Multi-Agent × MCP で実現する完全自律パフォーマンス改善 AI×オブザーバビリティ活用の最前線 by
NRUG Vol.17 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 1

辻亮佑 Ryosuke Tsuji 株式会社エアークローゼット執行役員CTO エンタープライズ向けシステム開発 → BtoCフロントエンド基盤構築。2015 年
エアークローゼットに参画。システム全体を管理しつつ、ビジネス全体とテクノロジーを管掌。日本最大級のファッションレンタルサービス airCloset を運営。

airCloset — 女性向けファッションレンタルプロのスタイリストが選んだ洋服が届く、月額制洋服レンタルサービス NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ
3

airCloset のシステム構成システム対象役割 Web / App お客さま登録・返却・フィードバック
スタイリングシステムスタイリストコーディネート選定倉庫連携外部倉庫出荷・返却・検品連携 WMS 倉庫内在庫管理・ロケーション管理バッチサーバ自動処理サブスク決済・ステータス遷移管理コンソール社内 CS・在庫・分析基本的に全て内製 — 監視すべきシステムが多岐にわたる → だからこそ NewRelic NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 4

今日お伝えしたいこと NewRelicにはとてつもない量のメトリクスが眠っているでも「見る → 分析する → 対処する」には必ず人の工数がかかる MCPとマルチエージェントを組み合わせれば検出 →
原因特定 → 改善計画まで完全自律で回せる NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 5

こんな経験、ありませんか？ 1. アラートが来ても後回し — 「遅くなってるけど、今は機能開発が優先で...」 2. N+1やDBボトルネックが放置 — 「今は200msだし大丈夫」→ データ増加で突然
3秒に 3. 調査するにもコードを追うのが大変 — 遅いエンドポイントは分かった。でも原因のコードはどこ？ NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 6

NewRelic MCP を活用して作ったもの NewRelic MCP の NRQL 実行・メトリクス取得を Gemini Agent
のツールとして組み込み NR Analyzer — 完全自律型パフォーマンス分析AI 検出 → 原因コード特定 → 改善提案 → チケット起票まで人手ゼロ NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 7

NR Analyzer が解決すること毎朝9時、AIが自律的にAPMを分析 → 問題検出 → コード調査 → チケット起票
Cloud Scheduler (毎日 9:00 JST) ↓ Gemini Agent (NewRelic MCP で APM全体を分析) ↓ 問題検出 Gemini Agent (Git Server MCP で原因コード特定) ↓ 原因特定 + 改善提案 Backlog チケット自動作成 (日英併記) エンジニアが朝出社したら、原因コード付きの改善チケットが届いている NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 8

NewRelic MCP が提供するツール Gemini Agent がこれらのツールを自律的に選択・実行ツール機能 NR Analyzerでの使い方
get_entity APMアプリ一覧 prod環境のアプリを特定 analyze_golden_metrics ゴールデンメトリクス RT・エラー率・スループットの健全性確認 analyze_transactions トランザクション詳細 DB呼出回数・外部API呼出の分析 execute_nrql_query 任意NRQL実行 AI生成NRQLで詳細データ取得 AIが状況に応じてツールを選択 → NRQLも自動生成 → 人がクエリを書く必要なし NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 9

全体アーキテクチャ NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 10

検出する6つの問題タイプタイプ検知条件重視ポイント N+1クエリ DBクエリ > 15回/req & レスポンス
< 500ms 今は速いが将来爆発スロートランザクション平均 > 1000ms すでに遅い高エラー率エラー率 > 5% ユーザー影響大 DBボトルネック DB時間が全体の70%以上スケール阻害外部API依存外部呼出 > 10回/req 障害伝播リスクスループット急落前週比で大幅減少異常の兆候特に重視: 「現在は問題になっていないが、スケール時に爆発するリスク」 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 11

Phase 1 — NewRelic MCPで問題を発見 Gemini Agent が NewRelic MCP
を自律的に呼び出す Agent Loop の流れ Gemini: 「production APMの一覧を見せて」 ↓ tool_call NewRelic MCP: get_entity ↓ 結果 Gemini: 「このアプリのゴールデンメトリクスは？」 ↓ tool_call NewRelic MCP: analyze_golden_metrics ↓ 結果 Gemini: 「DBクエリ87回... これはN+1の疑いがある」 → Issue 生成ポイント NRQLをAIが自動生成調査の深さをAI自身が判断最大50回のツール呼び出し 5分タイムアウトで安全制限 1日20回の実行上限 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 12

Phase 1 に渡すプロンプト Cloud Schedulerから起動 → Gemini Agentに渡される指示 System Prompt（抜粋）
あなたはNewRelicのパフォーマンス分析エキスパートです。 ▪ スコープ - production APMアプリのみ - 過去24時間 ▪ 調査手順 1. get_entity でアプリ一覧取得 2. golden_metrics で健全性確認 3. analyze_transactions で詳細調査 User Prompt（抜粋）以下の問題を特定: 1. スロートランザクション (>500ms) 2. 高エラー率 (>3%) 3. N+1クエリ候補 (DB >11回/req) 4. DBボトルネック (DB >50%) 5. 外部API依存 (>5回/req) 特に重視: 「現在は問題ないが、スケール時に爆発するリスク」 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 13

Phase 2 — 4段階の Deep Investigation 検出された問題ごとにAIが深堀り調査 Step 1 Step
2 Step 3 Step 4 NewRelic分析 → 原因コード特定 → 改善提案生成 → レポート作成 10 calls / 90s 60 calls / 5min 30 calls / 3min 10 calls / 90s Step 1: NewRelic分析時系列データで変化点を特定「いつから悪化したか」を特定関連するコミットを検索 Step 2: 原因コード特定 git_grep で問題コードを検索ファイルを読んで呼出しチェーンを追跡 ORM別のアンチパターン検出 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 14

各Stepに渡すプロンプト（1/2） Step 1: NewRelic分析 ▪ ツール: execute_nrql_query, commit_search (BQ) ▪
調査タスク 1. 問題が最初に発生した時刻を特定 2. 悪化が始まった時刻を特定 3. 関連するコミットを特定 ▪ 出力: timeline, relatedCommits Step 2: 原因コード特定 ▪ ツール: git_grep, git_file, git_blame, git_log ▪ 最重要ルールファイルパスを推測しない必ず git_grep で検索してから開く ▪ 手順 1. ORM/フレームワーク特定 2. エンドポイント→コード追跡 3. 問題パターン検索 ▪ 出力: sourceCodeReferences NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 15

各Stepに渡すプロンプト（2/2） Step 3: 改善提案 ▪ ツール: git_grep, git_file ▪ 改善の観点
- N+1 → バッチクエリ/Eager Loading - DB → インデックス/キャッシュ - 遅延 → 非同期化/タイムアウト ▪ 出力 - improvements[] (コード例付き) - effort / impact 評価 Step 4: レポート作成 ▪ 目的: Backlogチケット用の最終レポートを作成 ▪ レポート要件 1. 問題の要約 2. 原因の特定 3. 改善提案と優先度の根拠 ▪ 出力 - rootCauseHypothesis (原因) - workaround (暫定対応) - permanentFix (恒久対応) NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 16

Tips: Agentic Loop の収束制御 AIが調査に没頭し、結論を出さないままループ上限に到達する問題 Before Agent: git_grep "handler" →
15件 Agent: git_file "handler.ts" → 200行 Agent: git_grep "findMany" → 8件 ...（max callsに到達） → 結論なしで終了 After — ツール結果に残り回数を注入【システム通知】残りツール呼び出し回数: 10回。調査を収束させ、結果をJSON形式で出力してください。 → AIが自律的に収束し結論を出す Step 2（原因特定）は残り10回、Step 4 は残り3回で発動。これだけで調査完了率が劇的に改善。 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 17

Deep Investigation: コード特定の実例 Step 2 — AIがgit grepから原因コードを特定する流れ AI: git_grep
"external-link" → src/modules/externalLink/handler.ts 発見 AI: git_file "src/modules/externalLink/handler.ts" → ループ内でDB呼び出しを発見 AI: git_grep "findMany|findFirst" file_pattern="*externalLink*" → 15箇所のDB呼び出し AI: git_blame "src/modules/externalLink/handler.ts" lines="45-60" → 2週間前のコミット最重要ルール: ファイルパス推測禁止 — 必ず git_grep で検索してからファイルを開く NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 18

Deep Investigation: 改善提案の生成 Step 3 → 4 — 具体的なコード改善案をレポート化 Step
3: 改善提案問題タイプ改善提案 N+1 バッチクエリ / Eager Loading DB インデックス追加 / キャッシュ外部API 並列化 / Circuit Breaker effort (small/medium/large) と impact (high/medium/low) を付与 Step 4: レポート統合 Backlogチケットのフォーマットで出力: 概要: 問題の要約期待した結果: DBクエリ5回以下実際の結果: 87回のクエリ発行原因: ループ内findMany 暫定対応策: eager loading追加恒久対応策: DataLoaderパターン NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 19

出力: 自動起票されるBacklogチケット（実例）エンジニアが朝見るチケット — 原因コード + 修正案付き NewRelic MCP ×
Multi-Agent — APM監視から改善計画まで工数ゼロ 20

重複排除と悪化検知同じ問題を何度もチケット化しない仕組み通知判定ロジック状態アクション新規チケット作成既知 (Open) スキップ
再発 (7日以内) コメント追加悪化コメント追加別の問題タイプコメント追加悪化判定の閾値レスポンスタイム: 3倍以上かつ 2秒超エラー率: +10pt以上かつ 15%超スループット: 50%以下に急落データストア Firestore: Issue状態管理・重複排除 BigQuery: 実行ログ・メトリクス保存 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 21

なぜ自前のGit Serverが必要なのか GitHub MCP の限界とAgentic AIの要件 GitHub MCP の問題 Rate
Limitが非常に厳しい Agentic Loopは1回の調査で60+ API 呼出し複数Issue × 複数リポジトリですぐ枯渇自前Git Server (MCP) GCE VM上で動作 git_grep , git_file , git_blame 等 6ツール Rate Limit なし全社リポジトリのクローンを保持 Agentic AI × 外部API = Rate Limitが最大のボトルネック。自前MCP で解決。 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 22

コスト驚くほど安い ~$7 / 月 Gemini 3.0 Flash 使用 1日1回
× 30日（実測値）内訳（1回あたり ~$0.23）項目トークン数コスト Input ~440K tokens ~$0.22 Output ~2.6K tokens ~$0.01 安全制限 1日 20回まで Agent Loop: 50 tool calls / 5分 Deep Investigation: 110 tool calls / 10分 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 23

ここからは MCPで広がる活用の話 NewRelic MCPと社内MCPを組み合わせることでエンジニアもCSも、工数が劇的に減っている。そしてこれらはNR Analyzerのさらなる強化にもつながる。 NewRelic MCP ×
Multi-Agent — APM監視から改善計画まで工数ゼロ 24

Graph RAG: コードを構造化して理解するソースコードをNode（点）とEdge（線）の関係性で表現 [API Endpoint]──calls──→[Service]──calls──→[Repository]──queries──→[DB Table] │ │ └──────────
1つのリクエストの全データフローを追跡可能 ──────────────┘ 一般的なRAG（検索ベース）質問 → Embedding検索 → 類似チャンク関係性を辿れない「この関数の呼出元は？」に答えられない Graph RAG（構造ベース）質問 → 起点Node特定 → Edge走査 → 全経路関係性を末端まで追跡 Cross-repository もEdge経由で接続 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 25

Code Graph と DB Graph 2つのGraphがNR Analyzerの調査精度を支える Code Graph —
ソースコードの依存関係 12リポジトリをパラメータレベルで追跡 tree-sitterを拡張した独自静的解析 GitHub Push → 自動更新 → エンドポイントから原因関数まで一直線 DB Graph — データベースの構造辞書 17DB・994テーブルを検索可能 ORM定義 → 自動Graph化セマンティック検索対応 → DBボトルネックのテーブル構造を即座に把握 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 26

社内MCPエコシステム NewRelic MCP以外にも、データソースごとにMCPを整備中 MCP Server 用途主なツール Git Server ソースコード調査
git_grep, git_blame, git_log Code Graph コード依存関係 search_nodes, trace_connections DB Graph DB構造 + クエリ search_tables, sql_query_database Biz Graph ビジネス指標 search_initiatives, compare_metrics CSがエンジニアに聞くことなく、DB Graph経由で問い合わせを自己解決。バグ調査もCode Graphで圧倒的に高速化。 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 27

将来展望: NewRelic × Graph × AI自律運用検出 → 修正 →
PR → デプロイまでAIで NewRelic MCP Code Graph MCP Git Server MCP ↓ 問題検出 ↓ 影響範囲特定 ↓ コード修正 ↓ ↓ ↓ └──── AI Orchestrator ──────────────────────────────────────┘ ↓ Pull Request 自動作成 ↓ CI / テスト自動実行 ↓ レビュー → マージ → 自動デプロイ年内目標: 一部のパフォーマンス問題（N+1クエリ等）は、検出からリリースまでAI が自律的に完結する世界を目指す NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 28

まとめ NR Analyzer NewRelic MCPで毎朝自動分析 4フェーズ Deep Investigation 原因コード特定 +
改善提案 Backlogチケット自動起票基盤としてのGraph + MCP Code Graph: ソースコード構造 DB Graph: データベース辞書社内MCP群でデータを構造化将来: 検出→修正→デプロイまで自律 NewRelicのデータは宝の山。MCPでAIに渡せば、人の工数ゼロで改善が回り始める。 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 29

Thank You! 質問・議論歓迎 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 30

NewRelic MCPを活用して、APM監視から改善計画立てるまでの工数がゼロになった話 b...

NewRelic MCPを活用して、APM監視から改善計画立てるまでの工数がゼロになった話 by エアークローゼット辻亮佑さん

NRUG member

More Decks by NRUG member

Featured

Transcript

NewRelic MCPを活用して APM監視から改善計画まで工数がゼロになった話 Multi-Agent × MCP で実現する完全自律パフォーマンス改善 AI×オブザーバビリティ活用の最前線 by

辻亮佑 Ryosuke Tsuji 株式会社エアークローゼット執行役員CTO エンタープライズ向けシステム開発 → BtoCフロントエンド基盤構築。2015 年

airCloset — 女性向けファッションレンタルプロのスタイリストが選んだ洋服が届く、月額制洋服レンタルサービス NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ

airCloset のシステム構成システム対象役割 Web / App お客さま登録・返却・フィードバック

今日お伝えしたいこと NewRelicにはとてつもない量のメトリクスが眠っているでも「見る → 分析する → 対処する」には必ず人の工数がかかる MCPとマルチエージェントを組み合わせれば検出 →

こんな経験、ありませんか？ 1. アラートが来ても後回し — 「遅くなってるけど、今は機能開発が優先で...」 2. N+1やDBボトルネックが放置 — 「今は200msだし大丈夫」→ データ増加で突然

NewRelic MCP を活用して作ったもの NewRelic MCP の NRQL 実行・メトリクス取得を Gemini Agent

NR Analyzer が解決すること毎朝9時、AIが自律的にAPMを分析 → 問題検出 → コード調査 → チケット起票

NewRelic MCP が提供するツール Gemini Agent がこれらのツールを自律的に選択・実行ツール機能 NR Analyzerでの使い方

全体アーキテクチャ NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 10

検出する6つの問題タイプタイプ検知条件重視ポイント N+1クエリ DBクエリ > 15回/req & レスポンス

Phase 1 — NewRelic MCPで問題を発見 Gemini Agent が NewRelic MCP

Phase 1 に渡すプロンプト Cloud Schedulerから起動 → Gemini Agentに渡される指示 System Prompt（抜粋）

Phase 2 — 4段階の Deep Investigation 検出された問題ごとにAIが深堀り調査 Step 1 Step

各Stepに渡すプロンプト（1/2） Step 1: NewRelic分析 ▪ ツール: execute_nrql_query, commit_search (BQ) ▪

各Stepに渡すプロンプト（2/2） Step 3: 改善提案 ▪ ツール: git_grep, git_file ▪ 改善の観点

Tips: Agentic Loop の収束制御 AIが調査に没頭し、結論を出さないままループ上限に到達する問題 Before Agent: git_grep "handler" →

Deep Investigation: コード特定の実例 Step 2 — AIがgit grepから原因コードを特定する流れ AI: git_grep

Deep Investigation: 改善提案の生成 Step 3 → 4 — 具体的なコード改善案をレポート化 Step

出力: 自動起票されるBacklogチケット（実例）エンジニアが朝見るチケット — 原因コード + 修正案付き NewRelic MCP ×

重複排除と悪化検知同じ問題を何度もチケット化しない仕組み通知判定ロジック状態アクション新規チケット作成既知 (Open) スキップ

なぜ自前のGit Serverが必要なのか GitHub MCP の限界とAgentic AIの要件 GitHub MCP の問題 Rate

コスト驚くほど安い ~$7 / 月 Gemini 3.0 Flash 使用 1日1回

ここからは MCPで広がる活用の話 NewRelic MCPと社内MCPを組み合わせることでエンジニアもCSも、工数が劇的に減っている。そしてこれらはNR Analyzerのさらなる強化にもつながる。 NewRelic MCP ×

Graph RAG: コードを構造化して理解するソースコードをNode（点）とEdge（線）の関係性で表現 [API Endpoint]──calls──→[Service]──calls──→[Repository]──queries──→[DB Table] │ │ └──────────

Code Graph と DB Graph 2つのGraphがNR Analyzerの調査精度を支える Code Graph —

社内MCPエコシステム NewRelic MCP以外にも、データソースごとにMCPを整備中 MCP Server 用途主なツール Git Server ソースコード調査

将来展望: NewRelic × Graph × AI自律運用検出 → 修正 →

まとめ NR Analyzer NewRelic MCPで毎朝自動分析 4フェーズ Deep Investigation 原因コード特定 +

Thank You! 質問・議論歓迎 NewRelic MCP × Multi-Agent — APM監視から改善計画まで工数ゼロ 30

NewRelic MCPを活用して、APM監視から改善計画立てるまでの工数がゼロになった話 b...

NewRelic MCPを活用して、APM監視から改善計画立てるまでの工数がゼロになった話 by エアークローゼット 辻 亮佑さん

More Decks by NRUG member

Featured

Transcript

NewRelic MCPを活用して、APM監視から改善計画立てるまでの工数がゼロになった話 by エアークローゼット辻亮佑さん