Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ハーネスエンジニアリングとは?

Avatar for kinopee kinopee
April 24, 2026

 ハーネスエンジニアリングとは?

Harness Engineering Meetup Tokyo #1、TOPバッターとして、ハーネスエンジニアリングについての導入的説明を行いました。

Avatar for kinopee

kinopee

April 24, 2026

More Decks by kinopee

Other Decks in Programming

Transcript

  1. H A R N E S S E N G

    I N E E R I N G ・ 2 0 2 6 ハーネスエンジニアリング 5つの流派 実装が先、命名は後 ── 定義の揺れを現場感覚で読み解く Kinopee / 2026.04
  2. 5つの流派 同じ「ハーネス」を語っていても、論者が原器にしている実装で重心が違う 1 Chase派 広義・分類論 代 表 者 Harrison Chase

    (LangChain) 中 核 主 張 モデル以外の すべてがハーネス 2 Hashimoto派 運用哲学 代 表 者 Mitchell Hashimoto 中 核 主 張 失敗したら環境を 再設計せよ 3 Fowler派 制御理論 代 表 者 Martin Fowler (Thoughtworks) 中 核 主 張 コンテキスト設計の 特殊形として定義 4 Chawla派 同心円モデル 代 表 者 Avi Chawla (教育系) 中 核 主 張 LLMのOS層 三重の入れ子 5 Codex派 スケール駆動 代 表 者 Ryan Lopopolo (OpenAI Codex) 中 核 主 張 スケールで壊れる 問題の答え 02 / 13
  3. 1 C H A S E S C H O

    O L ・ B R O A D D E F I N I T I O N Chase派 広義ハーネス / 分類論 「モデル以外のすべて」を一括でハーネスとして囲い込む 代表 者 Harrison Chase (LangChain創業者) 時 期 ・ 出 典 2025年10月 ブログ「Agent Frameworks, Runtimes, and Harnesses」 原 器 と な っ た 実 装 DeepAgents (LangChain) 中 核 主 張 ▪ framework / runtime / harness の三分類を提示 ▪ ツール実行・メモリ・サブエージェント・ガードレール・オーケスト レーションまで全部ハーネスに畳み込む ▪ ハーネスは「コンテキストを生成する外側の層」であり、コンテキス ト設計はその一構成要素 ▪ 原器がDeepAgentsなので、総合フレームワーク設計の話として語ら れがち 特 徴 的 フ レ ー ズ If you're not the model, you're the harness. ── Vivek Trivedy (LangChain) 03 / 13
  4. 1 C O N C E P T D I

    A G R A M Chase派 広義ハーネス / 分類論 H A R N E S S ツール メモリ コンテキスト ビルダー サブ エージェント オーケスト レーション MODEL (LLM) ガードレール リトライ / 状態管理 「If you're not the model, you're the harness.」── モデル以外のすべての構成要素をハーネスとして囲い込む 04 / 13
  5. 2 H A S H I M O T O

    S C H O O L ・ O P E R A T I O N A L Hashimoto派 運用哲学 / 失敗駆動 エージェントの失敗を、再発不能にする環境設計の累積 代表 者 Mitchell Hashimoto (HashiCorp創業者) 時 期 ・ 出 典 2026年2月 自身のブログ記事 / OpenAI Codex事例と合わせて急速に普及 原 器 と な っ た 実 装 AGENTS.md / CLAUDE.md / .cursorrules 中 核 主 張 ▪ エージェントが失敗したら、物理的に同じミスができないよう環境を 再設計せよ ▪ AGENTS.mdに一行ずつ失敗防止ルールを追加していく「運用の累積 」がハーネスエンジニアリング ▪ 設計物としてではなく、育てていくプロセスとしてのハーネスを語る ▪ 日本の.cursorrules運用者と地続きで、現場感覚に最も近い流派 特 徴 的 フ レ ー ズ Agents aren't hard; the Harness is hard. ── Ryan Lopopolo (OpenAI Codex, 同流派で引 用) 05 / 13
  6. 2 C O N C E P T D I

    A G R A M Hashimoto派 運用哲学 / 失敗駆動 1 実行 エージェントが タスクを試みる 2 失敗 同じパターンで 繰り返し失敗 3 追記 AGENTS.mdに 失敗防止ルールを 1行追加 4 再発不能 同じ失敗が 物理的に 起こせなくなる ↻ 新しいタスクで再開 ── 失敗知識が AGENTS.md に累積していく 失敗のたびに環境が強くなる ── ハーネスは「設計物」ではなく「育てていくもの」 06 / 13
  7. 3 F O W L E R S C H

    O O L ・ C O N T R O L T H E O R Y Fowler派 狭義ハーネス / 制御理論 ハーネスはコンテキストエンジニアリングの特殊形 ── 包含関係を逆転 代表 者 Martin Fowler (Thoughtworks, Distinguished Engineer) 時 期 ・ 出 典 2026年 Thoughtworks記事「Harness engineering for coding agent users」 原 器 と な っ た 実 装 コーディングエージェント全般 (Claude Code / Cursor / Devin) 中 核 主 張 ▪ 他の流派と異なり、ハーネスをコンテキストの内側(特殊形)に位置づ ける唯一の派 ▪ guides (feedforward制御) と sensors (feedback制御) の両輪でエー ジェントを信頼に足るものにする ▪ 「不要な出力を事前に防ぐ仕組み」と「逸脱を検知して自己修正させ る仕組み」 ▪ 制御工学の語彙 (フィードバックループ・センサー) に接続する理論志 向 特 徴 的フレ ーズ ハーネス設計は コンテキスト設計の 特殊な一形態である。 ── Martin Fowler (趣旨) 07 / 13
  8. 3 C O N C E P T D I

    A G R A M Fowler派 狭義ハーネス / 制御理論 R E Q U E S T ユーザー要求 G UI D E S ルール・制約 事前制御 A G E N T LLM + ツール S E N S O RS テスト・lint 事後検証 O UT P U T 成果物 feedforward feedback 自己修正フィードバック guides (事前制御) × sensors (事後検証) の両輪でエージェントを信頼できる存在にする 08 / 13
  9. 4 C H A W L A S C H

    O O L ・ C O N C E N T R I C M O D E L Chawla派 同心円モデル / OS比喩 プロンプト ⊂ コンテキスト ⊂ ハーネスの三重入れ子で整理 代表 者 Avi Chawla (Daily Dose of DS) / 教育系 ライター群 時 期 ・ 出 典 2026年前半 「The Anatomy of an Agent Harness」ほか 原 器 と な っ た 実 装 特定ツールではなく概念モデル 中 核 主 張 ▪ プロンプト・コンテキスト・ハーネスを三重の同心円で整理する ▪ Beren Millidge (2023) のOS比喩を継承 ── LLMはCPU、コンテキス トはRAM、ツールはデバドラ、ハーネスはOS ▪ 定義の厳密さより、初学者への説明しやすさを優先する立場 ▪ Chase派と論理的には整合的だが、より図解寄り・入門記事向き 特 徴 的 フ レ ー ズ LLMは OSなしの裸のCPUだ。 ハーネスがOSに当たる。 ── Beren Millidge (2023, 継承されるアナロジー ) 09 / 13
  10. 4 C O N C E P T D I

    A G R A M Chawla派 同心円モデル / OS比喩 コン ピュ ータ LLM エー ジェ ント OS ハーネス デバイスドライバ ツール ディスク 外部DB / メモリ RAM コンテキスト CPU LLM "LLMはOSを持たない裸のCPUに過ぎない。ハーネスがOSの役割を担う" 10 / 13
  11. 5 C O D E X S C H O

    O L ・ S C A L E - D R I V E N Codex派 スケール駆動 / プロダクション答え プロダクションスケールで壊れる問題への答えとしてハーネスを定義 代表 者 Ryan Lopopolo / OpenAI Codexチーム 時 期 ・ 出 典 2026年2月 OpenAIの事例公表 (3人で百万 行、95%AI生成) 原 器 と な っ た 実 装 OpenAI Codex / その内部ハーネス 中 核 主 張 ▪ プロンプトでもコンテキストでも解けない、多段ステップ・自律実行 ・並列特有の故障モードが存在する ▪ その故障モードを解くのがハーネス、というスケール駆動の動機づけ ▪ 他流派と直接対立はせず、ハーネス概念が必要になった理由を提供す る立場 ▪ 登壇の導入 (なぜ今この概念が要請されたか) に使いやすい 特 徴 的 フ レ ー ズ Agents aren't hard; the Harness is hard. ── Ryan Lopopolo (OpenAI Codex) 11 / 13
  12. 5 C O N C E P T D I

    A G R A M Codex派 スケール駆動 / プロダクション答え P R OM P T E N G . 2022– 単発プロンプト C O NT E X T EN G . 2024– RAG / マルチターン H A RN E S S E N G . 2026– 自律・並列・本番 3 engineers → 1M lines 95% AI-generated (OpenAI Codex) "Agents aren't hard; the Harness is hard." ── プロダクションスケール特有の故障モードを解くのがハーネス 12 / 13
  13. 対立の構造 包含関係が逆転する ── 流派間のいちばん劇的な噛み合わなさ Chase派 / Chawla派 ハーネス ⊃ コンテキスト

    ハーネス (外層) コンテキスト プロンプト 総合フレーム設計の視点 Fowler派 コンテキスト ⊃ ハーネス コンテキスト設計 (外層) ハーネス (特殊形) guides + sensors 制御理論 (feedforward / feedback) の視点 日本に紹介する際は、どちらの意味で語られているかを毎回明示する必要がある 13 / 13
  14. F O U N D A T I O N

    ハーネスとガードレール AIコーディングを支える、役割の違う2つの仕組み H A R N E S S ハーネス = 馬具 ▪ カスタムインストラクション / プラン ▪ Skills ▪ サブエージェント G U A R D R A I L S ガードレール = 道を外れないための柵 ▪ 静的解析 (lint, 型チェック) ▪ ビルド ▪ テスト 進路を示すハーネス、道を外れないよう守るガードレール ── これがAIコーディングの土台 01 / 05
  15. H A R N E S S I N D

    E T A I L ハーネス = 馬具 ── 走り出す前に「どう走ってほしいか」を伝える層 馬具 (bridle & reins) 役 割 走り出す前に「どう走ってほしいか」を馬具で伝え る ── 事前設計の層 具 体 的 な 道 具 ▪ カスタムインストラクション / プラン ▪ Skills ▪ サブエージェント 私 の 主 張 日本の現場は、名前がつく前から既にやっていた。 実装が先、命名は後 ── 現場感覚の延長線上に「ハーネス 」という言葉が乗っただけ。 02 / 05
  16. G U A R D R A I L S

    I N D E T A I L ガードレール = 道を外れないための柵 ── 走った後に「逸脱していないか」を検証する層 防護柵 (guardrails) 役 割 走った後に「道から外れていないか」を機械で自動 検証する ── 事後検証の層 具 体 的 な 仕 組 み ▪ 静的解析 (lint, 型チェック) ▪ ビルド ▪ テスト 私 の 主 張 ハーネスは主観、ガードレールは客観。 機械的な判定が強いほど、エージェントにハンドルを預け られる ── 自律性を上げる鍵はここ。 03 / 05
  17. F E E D B A C K L O

    O P フィードバック・ループ 馬具と柵だけでは、馬は目的地にたどり着けない 1 走らせる エージェントに タスクをやらせる 2 逸脱を観察 期待からの ズレを検知する 3 軌道を戻す 失敗を受けて 修正・再実行 ↻ 繰り返す 具 体 的 に は テストが落ちたら → 直させる lint が出たら → 修正させる 型が通らなければ → やり直させる ── だから、定義に拘るよりも、馬具も柵もループも、今使える手段を全部使って結果を出しに行く 04 / 05
  18. C O N C L U S I O N

    言葉の定義は、重要ではない。 大切なのは、期待した結果を得ること。 今使える手段を総動員、 適切な場所で、適切に使って、良い結果を得ましょう。 05 / 05