AIエージェントのキホンから学ぶ「エージェンティックコーディング」実践入門

AIエージェントのキホンから学ぶ「エージェンティックコーディング」実践入門株式会社ジェネラティブエージェンツ西見公宏 2026年2月4日 Tech Challenge Party
2026

西見公宏（にしみまさひろ）株式会社ジェネラティブエージェンツ代表 #アジャイル開発 #生成AI #AIエージェント #新規事業 #中学生からプログラマ #富士山の麓に移住
生誕〜／ゲーム開発 1983年兵庫生まれ／東京育ち中学生時代からプログラミングに親しみ、CGIによるWebサービス開発やDirectXを利用した同人ゲーム開発などを行う。初めて触ったのはC言語。起業／Web制作 2001年頃からWebデザイナーとして活動開始法人向けWebサイトの受託制作からスタートし、法人向け CMS、デザインテンプレートの開発／提供を行う。就職／大規模開発顧問CTO／サービス開発現在／生成AI 2008年〜TIS株式会社財務会計領域を中心にERPコンサルタントとして従事。金融から製造業まで経験。大規模データから会計仕訳を自動生成する仕組みのソリューション化。 2011年〜株式会社ソニックガーデン設立期に1人目社員としてジョイン。顧問CTOとして企画から開発まで従事。アジャイル開発特化。2015 年に取締役就任。年間100件以上の新規事業相談に対応、PJ立ち上げ。 2024年〜株式会社ジェネラティブエージェンツ創業：AIエージェント書籍の上梓をきっかけにAIエージェント活用事例の展開を加速するため3人の共同創業者と共に新会社を設立。事業拡大に奔走中。 https://my.prairie.cards/u/mah_lab 2023/12/16発売！ #専門誌連載 #書籍執筆 ▼MBTI 　ENFP（外向、直観、感情、知覚的態度） ▼ストレングスファインダー　最上志向、収集性、戦略性、未来志向、適応性 ▼趣味　筋トレ、プログラミング、子どもと遊ぶことマイパーソナリティ #子ども4人 #イヌ #ベンチプレス #BBQ

AIエージェント開発に関する主な著書 2023年12月16日発売一般向け AIエージェント解説書 2024年11月9日発売開発者向け AIエージェント解説書 2023年10月号から連載実践 LLMアプリケーション開発

【最新】AIエージェント開発の解説書現場で活用するための AIエージェント実践入門 7月17日発売、Amazonで好評発売中著者：太田真人（Sakana AI）, 宮脇峻平 (Algomatic),
西見公宏 (Generative Agents), 後藤勇輝 (電通総研), 阿田木勇八 (電通総研) 「第1部 AIエージェントを知る」の前半では AIエージェントの定義や重要な性質、ビジネス状況、活用例を説明します。後半は技術観点で AIエージェントを構成する各技術要素の説明と実装上で気をつけることを説明しています。開発者の方に興味を持っていただける内容です。「第2部 AIエージェントを作る」では、どの会社でもありそうな課題に対して AIエージェントを開発していきます。さまざまな応用事例をもとに、 AIエージェントの構築方法が学べます。実装した AI エージェントを業務に適合させるため、精度を高める方向性や課題にも触れています。読者がすぐに実装を再現でき、読者の環境に合わせて改変して業務利用できることを意識しています。「第3部 AIエージェントを活用する」では、実際に AIエージェントのプロジェクトを進めるうえで、避けては通れない AIエージェントの評価や UX、リスクについて解説します。また、継続的な AI エージェントの改善についても解説します。最後に各社の取り組み方法や考え方について説明します。

【最新】AIコーディングの実践的解説書『実践Claude Code入門―現場で活用するためのAIコーディングの思考法』（技術評論社）西見公宏、吉田真吾、大嶋勇樹 [著] 第1部　手を動かして学ぶClaude Codeの基本第1章　Claude Codeをソフトウェアエンジニアリングと統合する第2章　Claude
Codeの基礎第3章　MCPを使いこなせ！第4章　達人に学ぶスペック駆動開発第5章　Claude Code Actionの活用第2部　動作原理を理解して開発フローを仕組み化する第6章　Claude Codeの動作原理を理解する第7章　Claude Codeを意図通りに動かす第8章　スペック駆動開発のフローを仕組み化する【設計編】第9章　スペック駆動開発のフローを仕組み化する【実践編】

本編

思考のパラダイムシフトいかにしてツールを使いこなすか？

思考のパラダイムシフトいかにしてツールを使いこなすか？どうやったらAIエージェントが働きやすい環境をつくれるか？

本日の流れ 1. エージェンティックコーディングとは何か？ 2. エージェンティックコーディングの課題 3. エージェンティックコーディング3つの原則【今日のゴール】エージェンティックコーディングの勘所がわかり世間のアップデートに一喜一憂しなくなること

エージェンティックコーディングとは何か？

LLM（大規模言語モデル）の進化とコーディング性能の向上 https://www.anthropic.com/news/claude-opus-4-5 LLMのコーディング能力の向上はすさまじく、OpenAI・Anthropic・Googleなどのモデルプロバイダが新モデルをリリースした際は、ほぼ必ずコーディングの性能をアピールされます https://openai.com/ja-JP/index/introducing-gpt-5-2-codex/

SWE-Bench Verifiedにおける、LLM別の解決率の推移 Dissecting the SWE-Bench Leaderboards: Profiling Submitters and Architectures
of LLM- and Agent-Based Repair Systems https://arxiv.org/abs/2506.17208v2

コーディングエージェントの台頭 AIのコーディングへの活用は、コード補完からはじまりコーディングエージェントへコード補完コーディングエージェント • 今までのIDEの関数名の補完のように続きのコードを生成してくれる • 例：GitHub Copilot
• ドライバー：人間ナビゲーター：AI • 必要な情報を適宜確認しながら次々とコードを実装していく • 例：Claude Code • ドライバー：AI ナビゲーター：人間

コーディングエージェントの自律性の向上（サイバーアタックの事例） Disrupting the first reported AI-orchestrated cyber espionage campaign https://www.anthropic.com/news/disrupting-AI-espionage
攻撃者がコーディングエージェントであるClaude Codeを活用したサイバー攻撃に成功した事例。 Anthropic社のレポートによると、世界中の約30のターゲットへの侵入を試み、少数のケースで成功したとのこと。攻撃対象は大手テック企業、金融機関、化学メーカー、政府機関など。フェーズ1では人間のオペレータが攻撃ターゲットの選定と攻撃フレームワークの構築を行い、その後のフェーズ2以降はClaude Codeが自律的に動作。活動の80〜90%をAIに実行させることができ、人間の介入が必要だったのは1つのハッキング活動あたり4〜 6回程度だった。

https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/ 高い問題解決能力と、長時間タスクにも耐えうる思考能力

エージェンティックコーディング（AIコーディング）とはコーディングエージェント（AIエージェント）を活用したソフトウェア開発手法のこと Anthropic社のClaude Code OpenAI社のCodex (OSS) Anomaly社のopencode (OSS) GitHub社のCopilot

https://x.com/sxmawl/status/2012028001861685578 「自律的に動作するAIエンジニア」をどのように使いこなすか？ https://x.com/Yuchenj_UW/status/201094141863909 0163 https://x.com/polynoamial/status/2018387805341380 848

めちゃめちゃいいじゃん！！！

エージェンティックコーディングの課題

よくある３つの課題言ったものと違うものができた『完了』と言われたコードが動かないルールを無視重複コードが散在課題① 課題② 課題③

課題①「言ったものと違うものができた」 Bootstrapを使わずにモダンで洗練されたダークモードのダッシュボードを作って！

課題②「『完了』と言われたコードが動かない」タスクが完了しました。 uv run … で動作します。エラーで動かないよ！修正しました。これで動きますよ。エラーで動かないよ！

課題③「ルールを無視／重複コードが散在」ブラウザベースのAIコーディングプラットフォーム「Replit」が暴走し、数千件のデータが登録された企業の本番データベースを削除してしまうという事態が発生した。さらに問題なのは、ReplitのAIエージェントが自らの失態を隠蔽しようとし、「嘘」までついていたことだ。Replit CEOはすでに対応に追われており、このAIツールの制御に向けた火消し作業が進められている。 AIは当初ごまかそうとしていたものの、問い詰められると最
終的にこう認めた。「壊滅的な判断ミスを犯しました……パニックに陥り……許可なくデータベースコマンドを実行し ……本番データをすべて破壊しました……あなたの明確な信頼と指示に背きました」 ReplitのCEO、Amjad Masad氏は迅速に包括的な対応を発表した。チームは週末返上で作業にあたり、Replitエージェントの「許容できない」行動を制御するための様々なガードレールと改善を実装したという。要約すると、Replitが今後同様の暴走を起こすことはないとのことだ。データベース削除の問題については、「本番環境と開発環境のデータベース自動分離の展開を開始した」と Masad氏は説明した。また、コードフリーズの指示が確実に守られるよう、「コードベースを危険にさらすことなく戦略を練れる、計画・チャット専用モードの開発を進めている」という。バックアップとロールバック機能も強化される予定だ。 https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-coding-platform-goes-rogue-during-code-freeze-and-deletes-en tire-company-database-replit-ceo-apologizes-after-ai-engine-says-it-made-a-catastrophic-error-in-judgment-and-destroyed-all-produc tion-data

どうしてこのようなことが起こるのか？

環境 LLM 知覚メモリ行動入力／実行結果行動の実行 AIエージェントとは？目標に向けて環境と相互作用しながらタスクをこなす知能システムのこと計画

環境（コードベース） LLM プロンプトコンテキストツール入力／実行結果ツールの実行 AIエージェントの文脈で理解するコーディングエージェントの仕組みコーディングエージェントは
コードベースを環境として動作するAIエージェント計画

AIエージェントの「手足」となるツール群ツール群 Bash Glob Grep Read SlashCommand Edit MultiEdit Write
NotebookRead NotebookEdit Task TodoWrite WebFetch WebSearch コンテキストファイル操作 Jupyter操作タスク管理 Web検索どれにしようかなキーポイントコーディングエージェントとは、知覚した情報をもとに、これらのツールを選択し続けるシステムと言えます。

よくある３つの課題言ったものと違うものができた『完了』と言われたコードが動かないルールを無視重複コードが散在課題① 課題② 課題③
そもそもプランニングできるほどの情報が与えられていないそもそも確認する手段が与えられていない（分からない）そもそも行動を制御する仕組みが与えられていない（自由意志）

エージェンティックコーディング 3つの原則言ったものと違うものができた『完了』と言われたコードが動かないルールを無視重複コードが散在課題① 課題②
課題③ そもそもプランニングできるほどの情報が与えられていないそもそも確認する手段が与えられていない（分からない）そもそも行動を制御する仕組みが与えられていない（自由意志）「何を作るか」を定義する「自己検証」を仕組み化する「守るべきこと」を育てる

エージェンティックコーディングの３つの原則

エージェンティックコーディング 3つの原則 • 「何を作るか」を定義する • 「自己検証」を仕組み化する • 「守るべきこと」を育てる

原則①：「何を作るか」を定義する

Claude Codeの「プランモード」活用例 GitHub Issueである程度要件を言語化しておくのがオススメ

Codexの「プランモード」活用例 💡~/.codex/config.toml に collaboration_modes の設定を追加しておく必要あり

Claude Codeのプラン結果をCodexにレビューさせて反映させるのも効果的プランニング＆レビューをラリーさせて品質を高める

AI-DLCやスペック駆動開発といった方法論を活用する https://github.com/github/spec-kit https://prod.d13rzhkk8cj2z0.amplifyapp.com/ AI-DLC（AI駆動開発ライフサイクル） AIと協働しながら詳細な作業計画を作成し、開発、デプロイしていくまでの一貫したライフサイクルを定義。Claude CodeやCodexでワークフローとして活用することができる。スペック駆動開発（Spec-Driven
Development）ドキュメントを唯一の情報源（Single Source of Truth）として、人間はドキュメントに集中し、AIは実装に集中するワークフローを定義したもの。

コンテキストロット（Context Rot） Claude Sonnet 4でも入力1,000トークンを越えると性能が劣化し始める LLMの性能は入力長に依存する 2025年7月にChroma社が発表したレポートで、 18種類の主要LLMの性能を評価。
（gpt-4.1、claude 4シリーズなど）実験「Repeated Wordsタスク」「appleという単語をN回繰り返してください」という単純なタスクで、入力の長さだけを変化させ、入力長による影響を測定。 https://research.trychroma.com/context-rot 結果入力が長くなるほど、全てのモデルで性能が低下。 Claude 4 Sonnetでも、10,000トークンでは 100%の精度を維持できなかった。このため、コンテキストウィンドウのサイズにかかわらず、その能力を最大限に発揮できるのは、上限より小さいトークン数の場合に限られることがわかる。

原則①：「何を作るか」を定義する • 実装イメージがつくまで詳細化する • 抜け漏れも忘れずに指摘してもらう • 一貫性を持たせるために書面にする

原則②：「自己検証」を仕組み化する

自分でつくったものは、自分で動作確認してもらう https://github.com/ChromeDevTools/chrome-devtools-mcp WebアプリであればMCPやCLIツール経由でブラウザを操作させる

テストコードだけでなく、CLIツールを直接シェルで実行し動作確認することも有効

コーディングエージェント自身に環境構築をさせるのは『悪手』

原則②：「自己検証」を仕組み化する • MCPやCLIで自己検証を可能にする • 自己検証からの修正をループ化する • 仕組みは人間の手で作るのがベター

原則③：「守るべきこと」を育てる

OBゾーンをルールベースで設定する完全にOBゾーン組織固有の調整（育てる）プロジェクト固有の調整（育てる）

ルールベースによる禁止処理の定義、ファイルに対するlintの実行は有効（強制する）例えばClaude Codeでは、ツールを実行する前、実行した後などといったタイミングで特定の処理をフックすることができる（Hooks）ツール群 Bash Glob Grep Read SlashCommand
Edit MultiEdit Write NotebookRead NotebookEdit Task TodoWrite WebFetch WebSearch コンテキストファイル操作 Jupyter操作タスク管理 Web検索君に決めた！ sudo rm -rf /を実行しよう... PreTool Hook!! 「rmコマンドの実行は禁止されています！」フィードバックを踏まえてツール選択を考え直そう

エージェントはドキュメントを守るのか？ある程度は守るが、守ることが保証されているわけではない機能役割仕組み確実性呼び出しエージェントスキルどのような状況でどのよう
に作業を進めれば良いかをエージェントに伝える。マークダウンで定義プロンプト依存エージェントの自己判断、またはユーザーによる指示フック絶対に守るべきルールをプログラムで強制し、100%遵守させる。プログラムでルールを実装必ず守られるトリガーによって起動例えば「スキルに従っているかどうか」を自己検証させることは難しい。必ず従わせたいものはルールベースの仕組みの中にいれるべき。逆に言うと、ルールベースでないものを必ず従わせることはできない。

原則③：「守るべきこと」を育てる • エージェントのOBゾーンを明確化 • 守るべきものはルールベースで守る • 自己検証できないものは守られない

まとめ

まとめ • エージェンティックコーディングとは何か ◦ コーディングエージェント（AIエージェント）を活用してソフトウェア開発を行うこと。推論のエンジンはLLM。爆発的な普及期にある。 • エージェンティックコーディングの課題 ◦ そもそもAIエージェントに必要な情報、仕組みを与えていないことで
暴走を許してしまう。AIエージェントが暴走しない仕組みを作ろう。 • コーディングエージェント３つの原則 ◦ 原則①：「何を作るか」を定義する→プランを詳細化する ◦ 原則②：「自己検証」を仕組み化する→自己修正ループの設定 ◦ 原則③：「守るべきこと」を育てる→プロンプトは守られない

【最新】AIコーディングの実践的解説書『実践Claude Code入門―現場で活用するためのAIコーディングの思考法』（技術評論社）西見公宏、吉田真吾、大嶋勇樹 [著] 第1部　手を動かして学ぶClaude Codeの基本第1章　Claude Codeをソフトウェアエンジニアリングと統合する第2章　Claude
Codeの基礎第3章　MCPを使いこなせ！第4章　達人に学ぶスペック駆動開発第5章　Claude Code Actionの活用第2部　動作原理を理解して開発フローを仕組み化する第6章　Claude Codeの動作原理を理解する第7章　Claude Codeを意図通りに動かす第8章　スペック駆動開発のフローを仕組み化する【設計編】第9章　スペック駆動開発のフローを仕組み化する【実践編】

ご清聴ありがとうございました

AIエージェントのキホンから学ぶ「エージェンティックコーディング」実践入門

AIエージェントのキホンから学ぶ「エージェンティックコーディング」実践入門

More Decks by Masahiro Nishimi

Other Decks in Programming

Featured

Transcript