Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Algothythm behind Gemini Enterprise Agent Desig...

Algothythm behind Gemini Enterprise Agent Designer (with least amount of inputs from human)

次の文献を対象にサーベイしたスライドを、技術的な検証のため Gemini CLI (Gemini 3.1) で作成したものです。作成時にはサーベイの結果に関連した情報は一切与えず、ツールの使い方の指示を与えるとともに、評価・評価基準の改善・アウトプットの改善を繰り返すよう指示することだけ行いました。

- Context Engineering 2.0: [2510.26493] Context Engineering 2.0: The Context of Context Engineering
- MLE-STAR: [2506.15692] MLE-STAR: Machine Learning Engineering Agent via Search and Targeted Refinement
- DS-STAR: [2509.21825] DS-STAR: Data Science Agent via Iterative Planning and Verification
- PlanGen: [2411.02275] PlanGen: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories
- MASS: [2502.02533] Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies
- H-Swarm: [2502.13840] Heterogeneous Swarms: Jointly Optimizing Model Roles and Weights
- Scaling Agent Systems: [2501.12948] Towards a Science of Scaling Agent Systems
- MCP: Model Context Protocol Specification (Anthropic / community-led)
- Skills: Agent Skills Standard (https://agentskills.io/)
- A2A: Agent-to-Agent Protocol (https://a2a-protocol.org/)

Avatar for Asei Sugiyama

Asei Sugiyama

February 22, 2026
Tweet

More Decks by Asei Sugiyama

Other Decks in Technology

Transcript

  1. Context Engineering 2.0: エン トロピー削減 対象: 長期タスクにおける人間と機械のイン タラクション。 前提: コンテキスト長には限界があり、情報

    圧縮が求められる。 必要性: 機械は暗黙の文脈を補完できないた め、システム側で対応。 結論: 単純なコンテキスト拡張はAttentionの 精度劣化を招く。 対策: 抽象化やサブエージェントによるコン テキスト隔離が不可欠。 Algothythm behind Gemini Enterprise Agent Designer Context Engineering 2.0: The Context of Context Engineering (Hua et al., 2025) 4
  2. DS-STAR: データサイエン スにおける反復的計画 対象: 異種フォーマットを含む複数デ ータソースの分析。 前提: 正解ラベルがなく、実行結果の みで計画を評価できない。 手法:

    Verifierが結果の「十分性」を判 定しフィードバック。 結論: 実行成功をゴールとする既存手 法より精度が高い。 課題: トークン消費量が約3.5倍に増加 するトレードオフが存在。 Algothythm behind Gemini Enterprise Agent Designer DS-STAR: Data Science Agent via Iterative Planning and Verification (Nam et al., 2025) 6
  3. MLE-STAR: MLエンジニア リングの局所的洗練 対象: Kaggle等での機械学習パイプラ イン構築。 前提: LLMは学習データに依存し、古 い手法に偏る傾向がある。 手法:

    Web検索で最新モデルを収集 し、影響の大きい部分のみ改善。 結論: コード全体を再生成するよりエ ラー蓄積を防ぎ高精度。 課題: テストデータを前処理に使うデ ータリークのリスクが高い。 Algothythm behind Gemini Enterprise Agent Designer MLE-STAR: Machine Learning Engineering Agent via Search and Targeted Refinement (Nam et al., 2025) 7
  4. PlanGEN: 推論アルゴリズ ムの動的選択 対象: カレンダー調整や数理・金融推論 など、複雑な計画立案。 前提: タスクの難易度は異なり、単一 の推論手法では対応不可。 手法:

    制約を抽出し、問題の複雑度に 応じてアルゴリズムを動的選択。 結論: 探索戦略の切り替え(Mixture of Algorithms)は有効。 課題: アルゴリズム選択がプロンプト に強く依存し、汎化に難あり。 Algothythm behind Gemini Enterprise Agent Designer PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving (Parmar et al., 2025) 8
  5. 3. Automated Design & Scaling: MASの自動設計とスケーリン グ則 Algothythm behind Gemini

    Enterprise Agent Designer A Survey on Multi-Agent System Design and Automation 9
  6. MASS: プロンプトとトポ ロジーの段階的最適化 対象: 推論やコーディング等の一般的 なマルチエージェント協調。 前提: 性能はプロンプトの質と接続構 造(トポロジー)に極めて敏感。 手法:

    個々のプロンプトを最適化した 上で、最適なトポロジーを探索。 結論: 複雑なトポロジーよりも個々の プロンプト設計が性能に直結。 対策: 無駄なトポロジーは性能を下げ るため、探索空間の枝刈りが必須。 Algothythm behind Gemini Enterprise Agent Designer Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies (Zhou et al., 2026) 10
  7. Heterogeneous Swarms: ロールと重みの結合最適化 対象: エージェントによる協調生成 (Collaborative generation) 。 前提: 異なる専門性を持つ複数のLLM

    モデルが利用可能であること。 手法: 連続的な隣接行列で入出力DAG を最適化し、重みをPSOで更新。 結論: タスクにより「ロール」か「専 門知識(重み) 」の重要度が変化。 課題: 計算コストが高く、実運用には 通信のスパース化が不可欠。 Algothythm behind Gemini Enterprise Agent Designer HETEROGENEOUS SWARMS: Jointly Optimizing Model Roles and Weights for Multi-LLM Systems (Feng et al., 2025) 11
  8. Scaling Agent Systems (1/2): タスク依存性 対象: 環境との継続的なインタラクションを 伴うAgenticなタスク。 前提: タスクの依存関係(並列か直列か)が

    パフォーマンスに直結。 結論: 「エージェントを増やせば性能が上が る」という仮説は否定。 事例: 並列化可能な金融分析タスクでは Centralized構成が有効。 事例: 順序依存の強いタスクでは通信オーバ ーヘッドで性能が低下。 Algothythm behind Gemini Enterprise Agent Designer Towards a Science of Scaling Agent Systems (Kim et al., 2025) 12
  9. Scaling Agent Systems (2/2): スケーリングの限界 ツールの代償: ツール呼び出しが多い タスクは単一エージェントが有利。 能力の飽和: 基礎性能が約45%を超え

    るタスクはMASの限界効用が低下。 エラー増幅: 独立型MASではエラーが 17.2倍に増幅され大失敗を招く。 対策: オーケストレーターによる検証 とエラー抑制構造が必須。 結論: MASの有効性は「タスクの分割 可能性」に完全に依存する。 Algothythm behind Gemini Enterprise Agent Designer Towards a Science of Scaling Agent Systems (Kim et al., 2025) 13
  10. 4. Synthesis & Guidelines: 実践的な設計指針 Algothythm behind Gemini Enterprise Agent

    Designer A Survey on Multi-Agent System Design and Automation 14
  11. サーベイからの客観的結論と設計指針 1. トポロジーより個のプロンプトを優先せよ (MASS, PlanGEN) 複雑なグラフ構造を組む前に、個別のプロンプトを徹底的に最適化する。 2. タスクの分割可能性を見極めよ (Scaling Agent

    Systems) MAS化は「並列処理」が可能なタスクのみ適用。他は単一エージェントで。 3. 検証とエラー隔離の仕組みを組み込め (DS-STAR, MLE-STAR) 出力を盲信せず「十分性」を判定し、コンテキストの肥大化を防ぐ。 4. 動的ルーティングとスパース化 (H-Swarm, PlanGEN) 複雑さに応じて推論手法や通信パスを間引き、コストと精度を最適化。 Algothythm behind Gemini Enterprise Agent Designer A Survey on Multi-Agent System Design and Automation 15