Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIエージェントのキホンから学ぶ「エージェンティックコーディング」実践入門

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.

 AIエージェントのキホンから学ぶ「エージェンティックコーディング」実践入門

2026年2月4日に開催された「Tech Challenge Party 2026」AIトラックで解説したスライドです。
=====
AIエージェントの教育・開発支援を専門とする会社でエージェンティックコーディングを徹底してきたエキスパートが、開発現場で本当に上手に活用するための実践方法をAIエージェントの基本から解説します。AIエージェントの基本から学ぶことで、最新情報に惑わされずにエージェンティックコーディングを実践することができるようになります。
=====
https://tcp.saj.or.jp/

Avatar for Masahiro Nishimi

Masahiro Nishimi

February 04, 2026
Tweet

More Decks by Masahiro Nishimi

Other Decks in Programming

Transcript

  1. 西見 公宏(にしみ まさひろ) 株式会社ジェネラティブエージェンツ代表 #アジャイル開発 #生成AI #AIエージェント #新規事業 #中学生からプログラマ #富士山の麓に移住

    生誕〜/ゲーム開発 1983年 兵庫生まれ/東京育ち 中学生時代からプログラミング に親しみ、CGIによるWebサー ビス開発やDirectXを利用した 同人ゲーム開発などを行う。初 めて触ったのはC言語。 起業/Web制作 2001年頃からWebデザイナー として活動開始 法人向けWebサイトの受託制 作からスタートし、法人向け CMS、デザインテンプレート の開発/提供を行う。 就職/大規模開発 顧問CTO/サービス開発 現在/生成AI 2008年〜TIS株式会社 財務会計領域を中心にERPコン サルタントとして従事。金融か ら製造業まで経験。大規模デー タから会計仕訳を自動生成する 仕組みのソリューション化。 2011年〜株式会社ソニックガーデン 設立期に1人目社員としてジョイ ン。顧問CTOとして企画から開発ま で従事。アジャイル開発特化。2015 年に取締役就任。年間100件以上の 新規事業相談に対応、PJ立ち上げ。 2024年〜株式会社ジェネラティブ エージェンツ創業:AIエージェン ト書籍の上梓をきっかけにAIエー ジェント活用事例の展開を加速す るため3人の共同創業者と共に新会 社を設立。事業拡大に奔走中。 https://my.prairie.cards/u/mah_lab 2023/12/16発売! #専門誌連載 #書籍執筆 ▼MBTI  ENFP(外向、直観、感情、知覚的態度) ▼ストレングスファインダー  最上志向、収集性、戦略性、未来志向、適応性 ▼趣味  筋トレ、プログラミング、子どもと遊ぶこと マイパーソナリティ #子ども4人 #イヌ #ベンチプレス #BBQ
  2. 【最新】AIエージェント開発の解説書 現場で活用するための AIエージェント実践入門 7月17日発売、Amazonで好評発売中 著者:太田 真人(Sakana AI), 宮脇 峻平 (Algomatic),

    西見 公宏 (Generative Agents), 後藤 勇 輝 (電通総研), 阿田木 勇八 (電通総研) 「第1部 AIエージェントを知る」の前半では AIエージェントの定義や重要な性質、ビジネス状況、 活用例を説明します。 後半は技術観点で AIエージェントを構成する各技術要素の説明と実装上で気をつけることを説 明しています。開発者の方に興味を持っていただける内容です。 「第2部 AIエージェントを作る」では、どの会社でもありそうな課題に対して AIエージェントを開発 していきます。さまざまな応用事例をもとに、 AIエージェントの構築方法が学べます。実装した AI エージェントを業務に適合させるため、精度を高める方向性や課題にも触れています。読者が すぐに実装を再現でき、読者の環境に合わせて改変して業務利用できることを意識していま す。 「第3部 AIエージェントを活用する」では、実際に AIエージェントのプロジェクトを進めるうえで、 避けては通れない AIエージェントの評価や UX、リスクについて解説します。また、継続的な AI エージェントの改善についても解説します。 最後に各社の取り組み方法や考え方について説明します。
  3. 【最新】AIコーディングの実践的解説書 『実践Claude Code入門―現場で活用するためのAIコーディングの思考法』(技術評論社) 西見公宏、吉田真吾、大嶋勇樹 [著] 第1部 手を動かして学ぶClaude Codeの基本 第1章 Claude Codeをソフトウェアエンジニアリングと統合する 第2章 Claude

    Codeの基礎 第3章 MCPを使いこなせ! 第4章 達人に学ぶスペック駆動開発 第5章 Claude Code Actionの活用 第2部 動作原理を理解して開発フローを仕組み化する 第6章 Claude Codeの動作原理を理解する 第7章 Claude Codeを意図通りに動かす 第8章 スペック駆動開発のフローを仕組み化する【設計編】 第9章 スペック駆動開発のフローを仕組み化する【実践編】
  4. コーディングエージェントの自律性の向上(サイバーアタックの事例) Disrupting the first reported AI-orchestrated cyber espionage campaign https://www.anthropic.com/news/disrupting-AI-espionage

    攻撃者がコーディングエージェントであるClaude Codeを活用したサイバー攻撃に成功した事例。 Anthropic社のレポートによると、世界中の約30の ターゲットへの侵入を試み、少数のケースで成功し たとのこと。 攻撃対象は大手テック企業、金融機関、化学メー カー、政府機関など。 フェーズ1では人間のオペレータが攻撃ターゲットの 選定と攻撃フレームワークの構築を行い、その後の フェーズ2以降はClaude Codeが自律的に動作。 活動の80〜90%をAIに実行させることができ、人間の 介入が必要だったのは1つのハッキング活動あたり4〜 6回程度だった。
  5. 課題③「ルールを無視/重複コードが散在」 ブラウザベースのAIコーディングプラットフォーム「Replit」 が暴走し、数千件のデータが登録された企業の本番データ ベースを削除してしまうという事態が発生した。さらに問題 なのは、ReplitのAIエージェントが自らの失態を隠蔽しようと し、「嘘」までついていたことだ。Replit CEOはすでに対応 に追われており、このAIツールの制御に向けた火消し作業が 進められている。 AIは当初ごまかそうとしていたものの、問い詰められると最

    終的にこう認めた。「壊滅的な判断ミスを犯しました……パ ニックに陥り……許可なくデータベースコマンドを実行し ……本番データをすべて破壊しました……あなたの明確な信 頼と指示に背きました」 ReplitのCEO、Amjad Masad氏は迅速に包括的な対応を発表し た。チームは週末返上で作業にあたり、Replitエージェントの 「許容できない」行動を制御するための様々なガードレール と改善を実装したという。 要約すると、Replitが今後同様の暴走を起こすことはないとの ことだ。データベース削除の問題については、「本番環境と 開発環境のデータベース自動分離の展開を開始した」と Masad氏は説明した。また、コードフリーズの指示が確実に 守られるよう、「コードベースを危険にさらすことなく戦略 を練れる、計画・チャット専用モードの開発を進めている」 という。バックアップとロールバック機能も強化される予定 だ。 https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-coding-platform-goes-rogue-during-code-freeze-and-deletes-en tire-company-database-replit-ceo-apologizes-after-ai-engine-says-it-made-a-catastrophic-error-in-judgment-and-destroyed-all-produc tion-data
  6. AIエージェントの「手足」となるツール群 ツール群 Bash Glob Grep Read SlashCommand Edit MultiEdit Write

    NotebookRead NotebookEdit Task TodoWrite WebFetch WebSearch コンテキスト ファイル操作 Jupyter操作 タスク管理 Web検索 どれにしようかな キーポイント コーディングエージェントとは、知覚した情報をもとに、これらのツールを選択し続けるシステムと言えます。
  7. よくある3つの課題 言ったものと 違うものができた 『完了』と言われた コードが動かない ルールを無視 重複コードが散在 課題① 課題② 課題③

    そもそもプランニング できるほどの情報が 与えられていない そもそも確認する手段 が与えられていない (分からない) そもそも行動を制御す る仕組みが与えられて いない(自由意志)
  8. エージェンティックコーディング 3つの原則 言ったものと 違うものができた 『完了』と言われた コードが動かない ルールを無視 重複コードが散在 課題① 課題②

    課題③ そもそもプランニング できるほどの情報が 与えられていない そもそも確認する手段 が与えられていない (分からない) そもそも行動を制御す る仕組みが与えられて いない(自由意志) 「何を作るか」を 定義する 「自己検証」を 仕組み化する 「守るべきこと」を 育てる
  9. コンテキストロット(Context Rot) Claude Sonnet 4でも 入力1,000トークンを越えると 性能が劣化し始める LLMの性能は入力長に依存する 2025年7月にChroma社が発表したレポートで、 18種類の主要LLMの性能を評価。

    (gpt-4.1、claude 4シリーズなど) 実験「Repeated Wordsタスク」 「appleという単語をN回繰り返してください」 という単純なタスクで、入力の長さだけを 変化させ、入力長による影響を測定。 https://research.trychroma.com/context-rot 結果 入力が長くなるほど、 全てのモデルで性能が低下。 Claude 4 Sonnetでも、10,000トークンでは 100%の精度を維持できなかった。 このため、コンテキストウィンドウの サイズにかかわらず、その能力を最大限に 発揮できるのは、上限より小さいトークン数の 場合に限られることがわかる。
  10. ルールベースによる禁止処理の定義、ファイルに対するlintの実行は有効(強制する) 例えばClaude Codeでは、ツールを実行する前、実行した後などといったタイミ ングで特定の処理をフックすることができる(Hooks) ツール群 Bash Glob Grep Read SlashCommand

    Edit MultiEdit Write NotebookRead NotebookEdit Task TodoWrite WebFetch WebSearch コンテキスト ファイル操作 Jupyter操作 タスク管理 Web検索 君に決めた! sudo rm -rf /を 実行しよう... PreTool Hook!! 「rmコマンドの実行は 禁止されています!」 フィードバックを 踏まえてツール選 択を考え直そう
  11. エージェントはドキュメントを守るのか? ある程度は守るが、守ることが保証されているわけではない 機能 役割 仕組み 確実性 呼び出し エージェント スキル どのような状況でどのよう

    に作業を進めれば良いかを エージェントに伝える。 マークダウンで定義 プロンプト依存 エージェントの自己 判断、またはユー ザーによる指示 フック 絶対に守るべきルールをプ ログラムで強制し、100%遵 守させる。 プログラムでルール を実装 必ず守られる トリガーによって起 動 例えば「スキルに従っているかどうか」を自己検証させることは難しい。 必ず従わせたいものはルールベースの仕組みの中にいれるべき。 逆に言うと、ルールベースでないものを必ず従わせることはできない。
  12. まとめ • エージェンティックコーディングとは何か ◦ コーディングエージェント(AIエージェント)を活用してソフトウェ ア開発を行うこと。推論のエンジンはLLM。爆発的な普及期にある。 • エージェンティックコーディングの課題 ◦ そもそもAIエージェントに必要な情報、仕組みを与えていないことで

    暴走を許してしまう。AIエージェントが暴走しない仕組みを作ろう。 • コーディングエージェント3つの原則 ◦ 原則①:「何を作るか」を定義する→プランを詳細化する ◦ 原則②:「自己検証」を仕組み化する→自己修正ループの設定 ◦ 原則③:「守るべきこと」を育てる→プロンプトは守られない
  13. 【最新】AIコーディングの実践的解説書 『実践Claude Code入門―現場で活用するためのAIコーディングの思考法』(技術評論社) 西見公宏、吉田真吾、大嶋勇樹 [著] 第1部 手を動かして学ぶClaude Codeの基本 第1章 Claude Codeをソフトウェアエンジニアリングと統合する 第2章 Claude

    Codeの基礎 第3章 MCPを使いこなせ! 第4章 達人に学ぶスペック駆動開発 第5章 Claude Code Actionの活用 第2部 動作原理を理解して開発フローを仕組み化する 第6章 Claude Codeの動作原理を理解する 第7章 Claude Codeを意図通りに動かす 第8章 スペック駆動開発のフローを仕組み化する【設計編】 第9章 スペック駆動開発のフローを仕組み化する【実践編】