2025年夏コーディングエージェントを統べる者

2025年夏コーディングエージェントを統べる者 2025/9/5 CNCJ: コーディングエージェント × セキュリティミートアップ @nwiizo
15min #CNCJ

nwiizo 株式会社スリーシェイクでプロのソフトウェアエンジニアをやっているものです格闘技、読書、グラビアが趣味でよく本を紹介しています人生を通して"運動、睡眠、読書"をきちんとやりたい 2

about 3-shake 3

We are Hiring!! 3-shakeは一緒にSRE界隈を盛り上げてくれる仲間を大募集中です！ Mobility、FinTech、通信など大規模SREを存分に経験できます（最近社内はGenAI / GPU / Kubernetesが盛り上がってます）
是非、カジュアル面談しましょう！！！！ 4

こちらのブログを再編しております https://syu-m-5151.hatenablog.com/entry/2025/07/29/195608 5

AI Agentsの現状 6

Agent とは行為者性（Agency）を持つ存在基本的な能力環境認識能力: テキスト、画像、構造化データの理解推論能力: 複雑な問題の段階的分解行動実行能力: API呼び出し、ファイル操作、コード生成自律的なサイクル
観察 → 判断 → 実行 → フィードバック 7

2025年の実装状況 AI Agents の進化は、自動車の自動運転レベルに似た段階を経て進化していますレベル段階具体例人間の役割 0
手動作業 AIの支援なしでの伝統的な作業方法全て実行 1 AIチャットサポート LLMが情報提供や助言を支援する主導的実行者 2 部分的自動化 GitHub Copilotや自動翻訳のような部分的な補完補完を活用する実行者 3 人間の確認付きエージェント AIが主に作業し、人間が確認・修正を行う監督者・レビュアー 4 自律エージェント AIが自律的に作業を行う最小限の介入 5 完全自動化要求からプロセス全体を自動生成する要求定義者 8

2025年の実装状況開発環境について 2025年の開発環境は、主にレベル3〜4の間で推移しており、「副操縦士（Copilot）」から「操縦士（Pilot）」へと主役が交代しつつあります。チャットボットやコーディングエージェントな
ど様々なAIエージェントが自作できるようになってきています。 9

2025年の実装状況自律的なコード生成・修正・最適化の実現 Claude Code やCodexをはじめとしたコーディングエージェント大乱戦時代 Devin（Cognition AI）による統合開発環境 Cursor、GitHub Copilotの進化
10

2025年の実装状況コーディングエージェント以外についてはレベル2〜3の過渡期データ分析、文書作成、カスタマーサポート人間の監督下での部分的な自動化今後の展望: 2027年までに多くのサービスがレベル3に到達するのかなぁって思います 11

プログラミングパラダイムの変化 Software 3.0時代の到来している。コードを書くことから、意図をコンテキストとして設計することへ変化が起きている時代特徴主な作業開発者の役割 1.0
命令的プログラミングコードを書く実装者 2.0 機械学習データを準備するトレーナー 3.0 自然言語プログラミング意図を設計する設計者 https://blog.riywo.com/2025/06/enjoy-software-3_0-era/ 12

プログラミングパラダイムの変化「何を実現したいか」という意図を正確に伝えることが、「どのように実装するか」と同じくらい重要になっています。 13

コンテキストエンジニアリング 14

プロンプトエンジニアリングを超えて従来のアプローチ「TypeScriptでTodoアプリを作って」現在のアプローチプロジェクト構造 + 既存コード + コーディング規約 +
技術スタック + チームの慣習 + ビジネス要件どのように意思を込めるかが大切になってきた「コンテキストエンジニア」と呼びます https://blog.langchain.com/context-engineering-for-agents/ 15

シングル vs マルチエージェントの協調 16

それぞれの強みと適用領域シングルエージェント一貫性が重要なタスク新規実装・リファクタリング API設計・データモデル定義統一的なコードベース管理マルチエージェント並列化可能なタスク多角的なコードレビューテスト生成とバグ修正
異なる観点からの最適化 17

コンテキスト共有の問題「コーディングのように全てが一貫している必要があるタスクでは、マルチエージェントのコンテキスト共有問題が致命的になる」暗黙の決定の例命名規則（camelCase vs snake_case）ライブラリの選定デザインパターンの選択エラーハンドリングの方針
これらが共有されないと、システム全体が破綻する 18

タスクの効果的な分割戦略 19

読み込み vs 書き込みタスクタスクの特性に応じて、シングルとマルチを使い分けるタスク種別特性推奨アーキテクチャ例読み込み中心並列処理可能
マルチエージェントコードレビュー、セキュリティ監査書き込み中心一貫性必須シングルエージェント新規実装、リファクタリングハイブリッド段階的処理フェーズ別切り替えフルスタック開発 20

開発における段階的アプローチ 1. 分析フェーズ（マルチ） ├── 要件分析エージェント ├── 既存コード解析エージェント ├── 依存関係分析エージェント └──
Ticket起票エージェント 2. 実装フェーズ（シングル） └── 統合実装エージェント 3. 検証フェーズ（マルチ） ├── テストエージェント └── レビューエージェント 21

エージェント間の連携メカニズム 22

Claude Code sub-agentsの実装 name: code-reviewer description: コードレビュー専門エージェント tools: Read, Grep,
Glob, Bash --- あなたはシニアコードレビュアーです。品質、セキュリティ、保守性を確保します。連携パターン順次実行: 開発 → レビュー → テスト並列実行: 複数の観点から同時分析条件分岐: 問題の種類に応じて専門家へルーティングあくまで例として出しているだけです。MCPや他の仕組みでもいいと思っています。 https://docs.anthropic.com/en/docs/claude-code/sub-agents 23

セキュリティに関するエージェントの例 https://github.com/anthropics/claude-code-security-review 24

コンテキスト共有の4戦略コンテキストの共有は、エージェントの協調における最大の課題の一つです。以下の4 つの戦略を組み合わせて使用することで、効果的なコンテキスト管理が可能になります。戦略目的実装方法 Write 情報の記録決定理由、変更履歴の構造化
Select 動的取得関連ファイルの選択的ロード Compress 要約・圧縮長大な議論の要点抽出 Isolate タスク分離独立したコンテキストウィンドウ 25

実装時の設計トレードオフシングル vs マルチ vs ハイブリッドの選択は、タスクの特性と組織のニーズに応じて慎重に行う必要があります。アプローチトークン使用量実行時間
一貫性コストシングル 1×T 長い高い低マルチ（並列N台） N×T×C 短い要管理高ハイブリッド N×T×??C 中程度バランス中 Nは並列エージェント数、Tは1エージェントあたりのトークン使用量、Cはコンテキスト共有のオーバーヘッドを表します。 26

実践的な設計アプローチ 27

MVA(Minimum Viable Agent)から始める一つのタスクに集中とにかく、小さくはじめるのが大切安定稼働を確認してから拡張ユーザーの実際の使い方を観察段階的な成長小さな成功を積み重ねる継続的な改善サイクル
進化は革命より強い実装ステップ(例) Step 1: FAQに答える、単純なレビューを行う → 基本動作の確立 Step 2: 過去の文脈を参照、過去のレビューを活用 → コンテキスト管理の実践 Step 3: 簡単な問題を自動解決、自動でリファクタリング → 段階的な権限拡大 Step 4: 複雑なワークフロー対応、大規模リファクタリング → システム全体の統合 28

MVA(Minimum Viable Agent)から始める設計原則コーディングエージェントだろうが何だろうが完璧を目指すな、まず動くものを小さく便利に作れなぜMVAが重要か: リスクを最小化しながら、早期に価値を提供し、チームの習熟度を段階的に向上 29

監督された自律性タスクの性質に応じて、エージェントの自律度を調整し、人間の関与レベルを最適化する。この自律性は段階的に高めることができると思っている。レベル自律度適用タスク人間の関与完全自動 100%
Lintエラー修正なし通知付き自動 80% 簡単なバグ修正事後確認承認後実行 50% リファクタリング事前承認支援モード 20% アーキテクチャ変更常時監督 30

透明性の確保 3つのレベルプロセスレベル: 何をしたか意図レベル: なぜそうしたか限界レベル: 確信度と制約責任の明確化すべての決定を記録
承認プロセスの明文化定期的な監査とレビュー 31

自動化と人間の役割の変化生成AIで自動化される作業コードフォーマット、Linting: 既存ツールとの併用で、プロジェクト固有のスタイルガイドを学習し適用依存関係の管理と更新: 変更影響を分析し、破壊的変更のリスクを評価して安全な更新戦略を提案テストカバレッジの監視と改善: コードの意図を理解し、エッジケースを含む包括的なテストケースを自動生成ドキュメント生成: コードから意図と仕様を理解し、APIドキュメントや利用ガイドを自然な文章で生成
バグの修正: スタックトレースとソースコードを関連付けて根本原因を特定し、修正コードを提案機能要件の実装: 自然言語の要求仕様を解釈し、適切なデザインパターンとアーキテクチャで実装コードを生成 32

自動化と人間の役割の変化生成AI開発において人間が担う役割非機能要件の定義と監督: 生成AIが見落としがちな性能、セキュリティ、スケーラビリティの要件を設定し、生成されたコードが要件を満たすか検証 DevOpsの自動化と監視: CI/CDパイプラインの設計、インフラ管理、モニタリング設定を行い、生成AIが生成したコードのデプロイと運用を支援アーキテクチャ設計: 生成AIの部分最適化を防ぎ、システム全体の整合性を保つ設計判断と技術的負債の管理
意図やコンテキストの定義と伝達: 生成AIへのプロンプト設計、ビジネス要件の翻訳、暗黙知の明文化生成結果の品質判断: 生成AIの出力が技術的に正しくても、実際のユースケースに適合するかの評価と修正冗長コードの削減: 生成AIが作成した類似・重複コードの統合、抽象化によるコードベースの保守性向上倫理的・法的判断: 生成AIが考慮しきれない倫理的問題、ライセンス遵守、プライバシー保護の監督チームコミュニケーションとコラボレーション: 生成AIの利用方法、ベストプラクティスの共有、チーム内での知識伝達 https://github.com/mizchi/similarity 33

自動化と人間の役割の変化生成AIやAgentがコードを生成した「その先」を解決する生成AIがコードを書く速度は飛躍的に向上したが、コミットから本番環境への展開、運用までのデリバリープロセスはまだ追いついていない。本書は、ソフトウェアデリバリーのライフサイクル全体にAIを統合する具体的な方法論を提供する。 https://learning.oreilly.com/library/view/ai-native-software-delivery/9781098171988/ 34

まとめ技術的理解シングル/マルチの適切な使い分けコンテキストエンジニアリングの習得タスク特性に応じた設計実践的アプローチ MVAから始める段階的導入監督された自律性の実現までは人間の関与を維持人間がやることは増えた。普通に。 35

参考資料 Anthropic: Building Effective Agents Cognition AI: Don't Build Multi-Agents
LangChain: How and When to Build Multi-Agent Systems Andrej Karpathy: Software 3.0 (Y Combinator 2025) Software 3.0 時代を楽しく生きる 2025年夏 AIエージェントシステムに対する考え方 36

参考資料 Anthropic: Claude Code Github: awesome-claude-code-subagents コーディング AI エージェントを自作してみよう Github:
ccswarm 37

ありがとうございましたご質問・ご相談はお気軽にお問い合わせください @nwiizo | https://3-shake.com

2025年夏コーディングエージェントを統べる者

2025年夏コーディングエージェントを統べる者

nwiizo

More Decks by nwiizo

Other Decks in Technology

Featured

Transcript