Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

AIコーディングエージェント(Manus)

Avatar for kondai kondai
December 02, 2025

 AIコーディングエージェント(Manus)

AIコーディングエージェントについてのスライドをManusを用いて作成した.

Avatar for kondai

kondai

December 02, 2025
Tweet

More Decks by kondai

Other Decks in Programming

Transcript

  1. エグゼクティブサマリー:市場の構造的変革 2024年から2025年にかけ、ソフトウェア開発ツールは「AIによるコード補完 (Autocomplete)」から「AIコーディングエージェントによる自律的タスク実行 (Autonomous Task Execution)」へと構造的に変革しました。AIは受動的な 存在から、開発者の意図(Intent)を汲み取り、ファイル走査、ターミナル実行、 エラー修正などを能動的に行う主体へと進化しています。 市場の4つの主要カテゴリ 技術的特異点

    AIネイティブIDE:Cursor, Windsurf ▸ プラットフォーム拡張型:GitHub Copilot, Amazon Q Developer ▸ ブラウザ完結型:Bolt.new ▸ 完全自律型:Devin ▸ コンテキスト認識の深化:LLMのコンテキストウィンドウ拡大と高度なRAG技術によ り、リポジトリ全体、外部ドキュメントまでを視野に入れた提案が可能に ▪ 開発者の役割転換:「コードを書く」から「AIの出力をレビューし、オーケストレーシ ョンする」上位レイヤーへ ▪
  2. AIコーディングエージェントを支えるコア技術 (1/2) 1. 大規模言語モデル(LLM)と推論能力の特化 マルチモデル戦略 推論(Reasoning)モデル 速度重視(Instant)モデル ドメイン特化モデル 2. RAGとコンテキスト管理の高度化

    課題:コンテキストの盲目 インデックス化(Indexing) リランキングとフィルタリング 単一の汎用モデルに依存せず、タスクに応じてモデルを動的に切り替え – 複雑なリファクタリングや設計に使用 – 例:OpenAI o1/o3, Claude 3.5/3.7 Sonnet – 応答速度よりも精度の高さが優先 – リアルタイム補完のための低レイテンシ軽量モデル – 例:Windsurf SWE-1-mini, Mistralベースのカスタムモデル – ソフトウェアエンジニアリング特有のタスクに特化 – 例:Windsurf SWE-1 – 汎用モデルでは解決できない微細な文脈理解を実現 – 「AIがプロジェクト全体を理解していない」という長年の課題を解決 – プロジェクト内の全ファイルをベクトル化 – ローカルまたはクラウド上のデータベースに格納 – ユーザーの質問に関連するコード断片を瞬時に検索 – 依存関係グラフや呼び出し履歴に基づいて選別 – 真に必要な情報のみを選別 – 回答の精度と幻覚抑制の重要な差別化要因 –
  3. AIコーディングエージェントを支えるコア技術 (2/2) 最新のエージェントは、コード生成だけでなく、IDEのAPIを通じて「行動」する能力を持 つことで自律性を獲得しています。 エージェント的自律性とツール使用 READ-THINK-ACT-OBSERVE ループ ファイル操作:複数のファイルを同時に作成・編集・削除 ▪ ターミナル操作:コマンド実行、出力読み取り、次のアクション決定

    ▪ ブラウザ操作:ドキュメント検索、プレビュー画面確認 ▪ Read (観察):ユーザーの意図、ファイルシステム、ターミナル出力を観察 1. Think (推論):次のアクションを決定 2. Act (行動):ファイル操作、ターミナル操作、ブラウザ操作を実行 3. Observe (結果確認):行動の結果を評価し、次のループへ 4.
  4. 主要AIネイティブIDEの深層分析 (1/2) - Cursor 技術的特徴 Shadow Workspace Composer機能 Tab (Copilot++)

    コンテキスト制御 .cursorrules @シンボル参照 価格・セキュリティ バックグラウンドでコードベースのコピーを保持 • AIが自由に探索・実験できる仮想サンドボックス環境 • メインエディタをブロックしない • 従来のコピペではなく、プロジェクト全体に直接適用 • 複数ファイルの変更案を並列生成 • ファイル単位または一括で Accept/Reject 可能 • コードレビュー体験に近いUI • 単純な次トークン予測ではない • カーソル移動履歴や直前の編集内容を分析 • 論理的な一貫性を保つリファクタリング提案 • プロジェクト単位でAIのシステムプロンプトを固定 • コード品質のガバナンスを強化 • @Codebase, @Files, @Web, @Docs • AIの探索範囲を厳密に定義 • Pro: $20/月(500回の高速リクエスト) • Privacy Mode: Zero Data Retention • 課題: Composerは大量トークン消費 •
  5. Windsurf:フロー状態を追求する「エージェントIDE」 Codeium社が開発。Cursorと類似のアプローチながら、「空気を読むパートナー」を目指す 技術アーキテクチャ Cascadeアーキテクチャ Flow Awareness(フロー認識) ディープコンテキスト SWE-1モデル 超低レイテンシ推論 ユーザー体験(UX)

    Next Edit Suggestion ターミナル統合 共同作業の再定義 経済性と安定性 価格 安定性の課題 総評:メリット 総評:デメリット IDE全体の状態機械として機能 – 単なるチャットウィンドウではない – 開いているファイル、カーソル位置、コマンド履歴を常時監視 – 明示的な指示なしに「ユーザーが何をしようとしているか」を推 論 – 変数追跡、定義へのジャンプなどの静的解析情報を統合 – 依存関係理解の深度が深い – 型定義変更時の影響範囲を正確に特定 – ソフトウェアエンジニアリング特化モデル – Claude 3.5 Sonnetと同等以上の性能 – 低コスト運用を実現 – Cerebras社との提携 – 専用チップによる超高速推論 – フロー状態の維持に貢献 – チャットで生成されたコードを適用 – 次々と修正箇所へカーソルを飛ばす – タブキーで変更を確定 – マウスクリック最小化 – ターミナル出力を直接読み取り – エラー発生時に即座に修正案を提示 – ログのコピペ作業が不要に – AIとの対話を「チャット」ではなく「共同作業」として設計 – 開発者の思考を中断させない工夫 – Pro: 月額15ドル(年払い/月払い) – Cursorより割安 – 無料プラン:機能制限が緩やか – 急速な機能追加に伴うバグ報告 – フォルダスキャン失敗、無限ロード、UIフリーズ – Cursorに一日の長がある – 超高速レスポンス – コンテキスト自動認識 – コストパフォーマンス – 過剰な自律性 – 安定性不足 – カスタマイズ性の低さ –
  6. プラットフォーム拡張型と特化型エージェント ツール名 カテゴリ 主な強み 弱点/課題 GitHub Copilot プラットフォーム拡張型 エコシステム統合 SDLC全般、マルチモデル戦略、IP補償、知財保護

    AIネイティブIDEに比べ、IDE体験の統合度が 低い Amazon Q Developer クラウド特化型 AWSインフラ構築 IaC、CLI統合、Java等のコード変換(マイグレーション) 汎用Web開発での提案精度、UXの洗練度が低 い Bolt.new ブラウザ開発 WebContainers 環境構築不要、ブラウザ内フルスタック開発、即時デプロイ トークン消費コストが高く、大規模開発には不 向き Amazon Qの特化性:AWSマネジメントコンソールでのログ分析、IAM権限不足などの運用保守(Ops)フェーズで極めて有用。 Bolt.newの革新性:ローカル環境構築の障壁を取り払い、起業家やプロトタイピングに最適。
  7. 完全自律型エンジニア Devin:理想と現実 自律実行プロセス 経済性 現実的な限界 適用可能なタスク リポジトリの探索と理解 1 実行計画の立案 2

    コードの修正 3 テスト実行とデバッグ 4 プルリクエスト作成 5 チームプラン:月額500ドル(他のAIツールの20倍以上) ▪ 課金方式:ACU(Agent Compute Unit)による計算単位課 金 ▪ 捉え方:「ツール代」ではなく「人件費」として考える必要 ▪ 環境構築で詰まる ▪ 無限ループに陥る ▪ 修正が的外れになる ▪ 独自アーキテクチャでの成功率が不安定 ▪ 単純なバグ修正 ▪ ライブラリのバージョンアップ ▪ テストコード記述 ▪ 定型的な保守タスク ▪
  8. 比較総括:機能・価格・対象ユーザー ツール名 カテゴリ 価格 (PRO) 主な強み 最適なユーザー層 Cursor AIネイティブIDE $20/月

    カスタマイズ性、マルチファイル編集、安定性 .cursorrules によるプロジェクトごとのAI挙動定義、Composer機能による大 規模リファクタリング 熟練エンジニア、複雑なプロジェクト Windsurf AIネイティブIDE $15/月 速度、フロー維持、コンテキスト自動認識 SWE-1モデルと専用ハードウェアによる低レイテンシ、Cascadeアーキテクチ ャ 新規開発、スピード重視の個人 GitHub Copilot プラットフォーム拡張 $10/月 (個人) $19/月 (Biz) エコシステム統合、マルチモデル、セキュリティ SDLC全般への介入、IP補償、知財保護、Copilot Workspace エンタープライズ、GitHubユーザー Amazon Q クラウド特化 $19/月 (Pro) 無料枠あり AWSインフラ構築、CLI統合、Java移行 IaC生成、コンソール統合、Amazon Q Code Transformation AWSヘビーユーザー、SRE、Ops Bolt.new ブラウザ開発 $20/月 (トークン制) 環境構築不要、即時デプロイ、フルスタック生成 WebContainers技術、ブラウザ内でのNode.js実行、ワンクリックデプロイ 起業家、プロトタイピング、非エンジニア Devin 自律エージェント $500/月~ (Team) 完全自律実行、非同期タスク処理 Jira/Linearチケットから自動実装、テスト実行、PR作成 予算潤沢なチーム、定型保守タスク自動化 注記:価格は2025年12月時点の情報です。各ツールは日進月歩で進化しており、機能や価格は変更される可能性があります。導入に際しては、最新の公式情報を確認することをお勧めします。
  9. 結論と将来展望 (1/2) 市場の分化と共存 2025年の市場は、一つのツールがすべてを支配するのではなく、「適材適所」のフェーズにあり ます。 日常的なコーディング 組織的な管理とセキュリティ 特定のタスク MCPによるコネクティビティの爆発 今後の最大の技術トレンドは、Anthropicが提唱し、WindsurfやCursorが採用を進めている

    MCP(Model Context Protocol)です。 MCPの役割 未来のエージェント 「Slackで報告されたバグを読み取り、Linearでチケット化し、Notionの仕様書を参照してコード を修正し、DBのマイグレーションを実行する」という一連の業務フロー全体をオーケストレーシ ョンする存在へと進化 複数のコンポーネントが連携する統合システムアーキテクチャ CursorまたはWindsurfがデファクトスタンダードに ▸ GitHub Copilotがインフラとして導入 ▸ クラウド構築にはAmazon Q ▸ プロトタイプにはBolt.new ▸ AIエージェントがIDEの枠を超える ▸ 外部ツールとの標準化された接続 ▸ Slack、Notion、Linear、Google Drive、PostgreSQLなどと連携 ▸
  10. 結論と将来展望 (2/2) 開発者の役割のシフト AIコーディングエージェントの普及は、開発者の役割に本質的なシフトを要求しています。 従来の役割 コーディング(Writing Code) 未来の役割 エンジニアリング(Designing &

    Reviewing) 求められるスキルセット 1 レビュー能力 AIが生成するコードの品質を瞬時に判断する能力。正確性、パフォーマンス、セキュリティの観点 から評価。 2 オーケストレーション能力 複数のAIツールや外部システムを連携させ、業務フロー全体を設計・管理する能力。MCPを活用し た統合。 3 コンテキストエンジニアリング能力 AIに適切なコンテキストと制約を与え、意図通りの出力を引き出す能力。プロンプト設計とシステ ムプロンプト管理。 AIの出力をレビューし、オーケストレーションする新しい開発者の役割