Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2025年夏 コーディングエージェントを統べる者

Avatar for nwiizo nwiizo
September 05, 2025

2025年夏 コーディングエージェントを統べる者

2025年9月5日(金)、台風接近という悪天候の中でしたが、「CNCJ: コーディングエージェント × セキュリティ ミートアップ」に登壇させていただきました。

天候の影響で現地参加が難しい方も多い中、オンラインでの参加や配信により、多くの方にお聞きいただくことができました。

### 📍 イベント情報
- 開催日: 2025年9月5日(金)
- イベント詳細: CNCFコミュニティページ

### 📹 録画・資料公開予定
- 録画: CNCJのYouTubeチャンネルにて後日公開予定
- 発表資料: Connpassページに掲載予定

### 📝 関連ブログ
今回の発表内容のベースとなった考え方については、こちらのブログ記事でも詳しく解説しています:
- 「2025年夏 AIエージェントシステムに対する考え方」

台風の中、ご参加・ご視聴いただいた皆様、ありがとうございました。

Avatar for nwiizo

nwiizo

September 05, 2025
Tweet

More Decks by nwiizo

Other Decks in Technology

Transcript

  1. 2025年の実装状況 AI Agents の進化は、自動車の自動運転レ ベルに似た段階を経て進化しています レベル 段階 具体例 人間の役割 0

    手動作業 AIの支援なしでの伝統的な作業方法 全て実行 1 AIチャットサポート LLMが情報提供や助言を支援する 主導的実行者 2 部分的自動化 GitHub Copilotや自動翻訳のような部分的な補完 補完を活用する実行者 3 人間の確認付きエージェント AIが主に作業し、人間が確認・修正を行う 監督者・レビュアー 4 自律エージェント AIが自律的に作業を行う 最小限の介入 5 完全自動化 要求からプロセス全体を自動生成する 要求定義者 8
  2. プログラミングパラダイムの変化 Software 3.0時代の到来している。 コードを書くことから、意図をコンテキストとして設計することへ 変化が起きている 時代 特徴 主な作業 開発者の役割 1.0

    命令的プログラミング コードを書く 実装者 2.0 機械学習 データを準備する トレーナー 3.0 自然言語プログラミング 意図を設計する 設計者 https://blog.riywo.com/2025/06/enjoy-software-3_0-era/ 12
  3. プロンプトエンジニアリングを超えて 従来のアプローチ 「TypeScriptでTodoアプリを作って」 現在のアプローチ プロジェクト構造 + 既存コード + コーディング規約 +

    技術スタック + チームの慣習 + ビジネス要件 どのように意思を込めるかが大切になってきた「コンテキストエンジニア」と呼びま す https://blog.langchain.com/context-engineering-for-agents/ 15
  4. 読み込み vs 書き込みタスク タスクの特性に応じて、シングルとマルチを使い分ける タスク種別 特性 推奨アーキテクチャ 例 読み込み中心 並列処理可能

    マルチエージェント コードレビュー、セキュリティ監査 書き込み中心 一貫性必須 シングルエージェント 新規実装、リファクタリング ハイブリッド 段階的処理 フェーズ別切り替え フルスタック開発 20
  5. 開発における段階的アプローチ 1. 分析フェーズ(マルチ) ├── 要件分析エージェント ├── 既存コード解析エージェント ├── 依存関係分析エージェント └──

    Ticket起票エージェント 2. 実装フェーズ(シングル) └── 統合実装エージェント 3. 検証フェーズ(マルチ) ├── テストエージェント └── レビューエージェント 21
  6. Claude Code sub-agentsの実装 name: code-reviewer description: コードレビュー専門エージェント tools: Read, Grep,

    Glob, Bash --- あなたはシニアコードレビュアーです。 品質、セキュリティ、保守性を確保します。 連携パターン 順次実行: 開発 → レビュー → テスト 並列実行: 複数の観点から同時分析 条件分岐: 問題の種類に応じて専門家へルー ティング あくまで例として出しているだけです。MCPや他の仕組みでもいいと思っています。 https://docs.anthropic.com/en/docs/claude-code/sub-agents 23
  7. 実装時の設計トレードオフ シングル vs マルチ vs ハイブリッドの選択は、タスクの特性と組織のニーズに応じて慎 重に行う必要があります。 アプローチ トークン使用量 実行時間

    一貫性 コスト シングル 1×T 長い 高い 低 マルチ(並列N台) N×T×C 短い 要管理 高 ハイブリッド N×T×??C 中程度 バランス 中 Nは並列エージェント数、Tは1エージェントあたりのトークン使用量、Cはコンテキス ト共有のオーバーヘッドを表します。 26
  8. MVA(Minimum Viable Agent)から始める 一つのタスクに集中 とにかく、小さくはじめるのが大切 安定稼働を確認してから拡張 ユーザーの実際の使い方を観察 段階的な成長 小さな成功を積み重ねる 継続的な改善サイクル

    進化は革命より強い 実装ステップ(例) Step 1: FAQに答える、単純なレビューを行う → 基本動作の確立 Step 2: 過去の文脈を参照、過去のレビューを活用 → コンテキスト管理の実践 Step 3: 簡単な問題を自動解決、自動でリファクタリング → 段階的な権限拡大 Step 4: 複雑なワークフロー対応、大規模リファクタリング → システム全体の統合 28
  9. 監督された自律性 タスクの性質に応じて、エージェントの自律度を調整し、人間の関与レベルを最適化 する。 この自律性は段階的に高めることができると思っている。 レベル 自律度 適用タスク 人間の関与 完全自動 100%

    Lintエラー修正 なし 通知付き自動 80% 簡単なバグ修正 事後確認 承認後実行 50% リファクタリング 事前承認 支援モード 20% アーキテクチャ変更 常時監督 30
  10. 自動化と人間の役割の変化 生成AI開発において人間が担う役割 非機能要件の定義と監督: 生成AIが見落としがちな性能、セキュリティ、スケーラビリティの要件を設定し、生成された コードが要件を満たすか検証 DevOpsの自動化と監視: CI/CDパイプラインの設計、インフラ管理、モニタリング設定を行い、生成AIが生成したコー ドのデプロイと運用を支援 アーキテクチャ設計: 生成AIの部分最適化を防ぎ、システム全体の整合性を保つ設計判断と技術的負債の管理

    意図やコンテキストの定義と伝達: 生成AIへのプロンプト設計、ビジネス要件の翻訳、暗黙知の明文化 生成結果の品質判断: 生成AIの出力が技術的に正しくても、実際のユースケースに適合するかの評価と修正 冗長コードの削減: 生成AIが作成した類似・重複コードの統合、抽象化によるコードベースの保守性向上 倫理的・法的判断: 生成AIが考慮しきれない倫理的問題、ライセンス遵守、プライバシー保護の監督 チームコミュニケーションとコラボレーション: 生成AIの利用方法、ベストプラクティスの共有、チーム内での知識伝達 https://github.com/mizchi/similarity 33
  11. 参考資料 Anthropic: Building Effective Agents Cognition AI: Don't Build Multi-Agents

    LangChain: How and When to Build Multi-Agent Systems Andrej Karpathy: Software 3.0 (Y Combinator 2025) Software 3.0 時代を楽しく生きる 2025年夏 AIエージェントシステムに対する考え方 36