Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIエージェント時代のハーネスエンジニアリングとは

Avatar for ため ため
March 07, 2026

 AIエージェント時代のハーネスエンジニアリングとは

AIエージェントが要件整理から実装、テストまで担う時代に入り、ソフトウェア開発の生産量は大きく伸びる一方で、人間の確認コストが新たな制約になりつつあります。本資料では、その制約を乗り越える考え方としてハーネスエンジニアリングを整理しました。焦点は、AIを単に賢く使うことではなく、望ましい方向に導く環境と仕組みをどう設計するかにあります。具体的には、必要な情報だけを渡すコンテキスト管理、逸脱を防ぐアーキテクチャ制約とガードレール、自動テストや評価AIを活用した多角的なフィードバックの3点を軸に解説しています

Avatar for ため

ため

March 07, 2026
Tweet

More Decks by ため

Other Decks in Business

Transcript

  1. AIの生成量が急激に増大している 開発に必要な工数 AIの処理量 ソフトウェア生産量 AIの処理量 開発に必要な工数 past now OpenAI Codexチームの実証

    AIエージェントが要件整理から実装、テス トまでを短期間で処理するようになり、こ れまで私たちが開発のために投入していた 工数と期間が激減している。 開発作業を積み上げて工数を請求するよう なビジネスは成立が難しくなった。 https://openai.com/index/harness-engineering/より ソフトウェア生産量
  2. ハーネスエンジニアリングとは AIエージェントの自律性と安全性を両立させるため、人間が望む方向に誘導する「手 綱(ハーネス)となる環境」と「フィードバックループ」を設計する技術。 https://www.philschmid.de/agent-harness-2026 より ハーネスエンジニアリングを構成する3つの柱 「エージェントハーネスは、AIモデルを包括し、長期実行タスクを 管理するインフラストラクチャです。ハーネスは、プロンプトプリ セット、ツール呼び出しの適切な処理、ライフサイクルフック、ま たはすぐに使用できる機能を提供します」

    AIに背景と目的、何をし たいのかを伝えつつ、特 定のタスクに必要な仕様 や現在の状態だけを精選 して渡す仕組み AIが「やってはいけない こと(依存関係のルール 違反など)」を機械的に ブロックする仕組み 人間ではなく、自動化さ れたテスト環境や評価用 AI等を使って、AIの出力 を継続的に検証・改善す る仕組み 1.コンテキスト管理 2.アーキテクチャ制約 とガードレール 3.品質評価と多角的な フィードバック
  3. コンテキスト管理(段階的開示と設計図の提供) ハーネス構成要素1 OpenAIは最初は1つの大きなAGENTS.md (1,000ページのマニュアル)にすべてを書くア プローチを試したが、失敗した ・コンテキストは希少な資源である ・すべてが「重要」なとき何も重要でなくなる ・分厚いマニュアルは即座に腐る ・単一の塊では機械的なチェックに向かない •目的、前提条件、用語定義を「目次」として渡す

    •詳細な構造化ドキュメントへ誘導する •単体テストをしやすい構造にする 大量の情報を一度に渡すと、AIの短期記憶(コンテキストウィンドウ)が埋まり、肝心な推論の精 度が落ちる。まずは全体像と目次だけを見せ、必要に応じて詳細なナレッジにアクセスさせる。
  4. 品質評価と多角的なフィードバック ハーネス構成要素3 AIの揺れを人間が目で追う形ではなく、成功条件を固定化し、AIが自らテストし、自律修正する循 環を設計する。多角的な評価指標を組み合わせてパイプラインを組み、品質を担保する。 コード生成とテスト実行 エラー、テレメトリ読み取りに 基づく自律修正 ⚫ エラーやログをAIが読み取れる形で渡し、 バグの再現と修正検証を自律化

    ⚫ 評価指標を人間の目に依存せず、ロジック とLLMを組み合わせたパイプラインを構築 ⚫ 人間は最終承認と高度な判断に集中する [形式検証]: 完全一致(ロジック型) [順序検証]: Rouge-L(LLM型) [意味検証]: コサイン類似度 METEOR (LLM型) エージェント 間のレビュー エラーの自動 検知
  5. 新たなエンジニア像に求められるスキル 企業独自の暗黙知をAIが可読できる環境仕様に変換する能力(The Translation Bridge Skill)がコアスキルとなる。 現場の暗黙知(法規制・商慣習 ・複雑な業務ロジック) AI可読な環境仕様 (境界条件/データ定義/禁止条件) The

    Translation Bridge Skill ツールの導入支援ではなく、AIの価値を最大化しながら人間のコストを継続的に下げ る仕組み(再現性のあるハーネス)を提供することが顧客価値となる。 ITエンジニアはインヴァイロメントアーキテクトへ AI開発の下請け競争は激化するが、AIガバナンスと検証の仕組みを提供できるベンダは生き残る