Algothythm behind Gemini Enterprise Agent Designer (with least amount of inputs from human)

Algothythm behind Gemini Enterprise Agent Designer マルチエージェントシステムの設計指針と自動構築アルゴリズム Algothythm behind Gemini
Enterprise Agent Designer A Survey on Multi-Agent System Design and Automation 1

本プレゼンテーションの目的背景: 単一LLMの限界を突破するため、複数エージェントによるMASが注目。課題: 「とにかくエージェントを増やす」ヒューリスティックな設計が横行。目的: 最新論文を通じ、MASの自動構築や科学的な設計指針を客観的に示す。 Algothythm behind Gemini

1. Context & Foundation: エージェントとコンテキストの基盤 Algothythm behind Gemini Enterprise Agent
Designer A Survey on Multi-Agent System Design and Automation 3

Context Engineering 2.0: エントロピー削減対象: 長期タスクにおける人間と機械のインタラクション。前提: コンテキスト長には限界があり、情報
圧縮が求められる。必要性: 機械は暗黙の文脈を補完できないため、システム側で対応。結論: 単純なコンテキスト拡張はAttentionの精度劣化を招く。対策: 抽象化やサブエージェントによるコンテキスト隔離が不可欠。 Algothythm behind Gemini Enterprise Agent Designer Context Engineering 2.0: The Context of Context Engineering (Hua et al., 2025) 4

2. Specialized Agents: タスク特化型エージェントの最適化 Algothythm behind Gemini Enterprise Agent Designer
A Survey on Multi-Agent System Design and Automation 5

DS-STAR: データサイエンスにおける反復的計画対象: 異種フォーマットを含む複数データソースの分析。前提: 正解ラベルがなく、実行結果のみで計画を評価できない。手法:
Verifierが結果の「十分性」を判定しフィードバック。結論: 実行成功をゴールとする既存手法より精度が高い。課題: トークン消費量が約3.5倍に増加するトレードオフが存在。 Algothythm behind Gemini Enterprise Agent Designer DS-STAR: Data Science Agent via Iterative Planning and Verification (Nam et al., 2025) 6

MLE-STAR: MLエンジニアリングの局所的洗練対象: Kaggle等での機械学習パイプライン構築。前提: LLMは学習データに依存し、古い手法に偏る傾向がある。手法:
Web検索で最新モデルを収集し、影響の大きい部分のみ改善。結論: コード全体を再生成するよりエラー蓄積を防ぎ高精度。課題: テストデータを前処理に使うデータリークのリスクが高い。 Algothythm behind Gemini Enterprise Agent Designer MLE-STAR: Machine Learning Engineering Agent via Search and Targeted Refinement (Nam et al., 2025) 7

PlanGEN: 推論アルゴリズムの動的選択対象: カレンダー調整や数理・金融推論など、複雑な計画立案。前提: タスクの難易度は異なり、単一の推論手法では対応不可。手法:
制約を抽出し、問題の複雑度に応じてアルゴリズムを動的選択。結論: 探索戦略の切り替え（Mixture of Algorithms）は有効。課題: アルゴリズム選択がプロンプトに強く依存し、汎化に難あり。 Algothythm behind Gemini Enterprise Agent Designer PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving (Parmar et al., 2025) 8

3. Automated Design & Scaling: MASの自動設計とスケーリング則 Algothythm behind Gemini

MASS: プロンプトとトポロジーの段階的最適化対象: 推論やコーディング等の一般的なマルチエージェント協調。前提: 性能はプロンプトの質と接続構造（トポロジー）に極めて敏感。手法:
個々のプロンプトを最適化した上で、最適なトポロジーを探索。結論: 複雑なトポロジーよりも個々のプロンプト設計が性能に直結。対策: 無駄なトポロジーは性能を下げるため、探索空間の枝刈りが必須。 Algothythm behind Gemini Enterprise Agent Designer Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies (Zhou et al., 2026) 10

Heterogeneous Swarms: ロールと重みの結合最適化対象: エージェントによる協調生成（Collaborative generation）。前提: 異なる専門性を持つ複数のLLM
モデルが利用可能であること。手法: 連続的な隣接行列で入出力DAG を最適化し、重みをPSOで更新。結論: タスクにより「ロール」か「専門知識（重み）」の重要度が変化。課題: 計算コストが高く、実運用には通信のスパース化が不可欠。 Algothythm behind Gemini Enterprise Agent Designer HETEROGENEOUS SWARMS: Jointly Optimizing Model Roles and Weights for Multi-LLM Systems (Feng et al., 2025) 11

Scaling Agent Systems (1/2): タスク依存性対象: 環境との継続的なインタラクションを伴うAgenticなタスク。前提: タスクの依存関係（並列か直列か）が
パフォーマンスに直結。結論: 「エージェントを増やせば性能が上がる」という仮説は否定。事例: 並列化可能な金融分析タスクでは Centralized構成が有効。事例: 順序依存の強いタスクでは通信オーバーヘッドで性能が低下。 Algothythm behind Gemini Enterprise Agent Designer Towards a Science of Scaling Agent Systems (Kim et al., 2025) 12

Scaling Agent Systems (2/2): スケーリングの限界ツールの代償: ツール呼び出しが多いタスクは単一エージェントが有利。能力の飽和: 基礎性能が約45%を超え
るタスクはMASの限界効用が低下。エラー増幅: 独立型MASではエラーが 17.2倍に増幅され大失敗を招く。対策: オーケストレーターによる検証とエラー抑制構造が必須。結論: MASの有効性は「タスクの分割可能性」に完全に依存する。 Algothythm behind Gemini Enterprise Agent Designer Towards a Science of Scaling Agent Systems (Kim et al., 2025) 13

4. Synthesis & Guidelines: 実践的な設計指針 Algothythm behind Gemini Enterprise Agent
Designer A Survey on Multi-Agent System Design and Automation 14

サーベイからの客観的結論と設計指針 1. トポロジーより個のプロンプトを優先せよ (MASS, PlanGEN) 複雑なグラフ構造を組む前に、個別のプロンプトを徹底的に最適化する。 2. タスクの分割可能性を見極めよ (Scaling Agent
Systems) MAS化は「並列処理」が可能なタスクのみ適用。他は単一エージェントで。 3. 検証とエラー隔離の仕組みを組み込め (DS-STAR, MLE-STAR) 出力を盲信せず「十分性」を判定し、コンテキストの肥大化を防ぐ。 4. 動的ルーティングとスパース化 (H-Swarm, PlanGEN) 複雑さに応じて推論手法や通信パスを間引き、コストと精度を最適化。 Algothythm behind Gemini Enterprise Agent Designer A Survey on Multi-Agent System Design and Automation 15

Algothythm behind Gemini Enterprise Agent Desig...

Algothythm behind Gemini Enterprise Agent Designer (with least amount of inputs from human)

Asei Sugiyama

More Decks by Asei Sugiyama

Other Decks in Technology

Featured

Transcript

Algothythm behind Gemini Enterprise Agent Designer マルチエージェントシステムの設計指針と自動構築アルゴリズム Algothythm behind Gemini

1. Context & Foundation: エージェントとコンテキストの基盤 Algothythm behind Gemini Enterprise Agent

Context Engineering 2.0: エントロピー削減対象: 長期タスクにおける人間と機械のインタラクション。前提: コンテキスト長には限界があり、情報

2. Specialized Agents: タスク特化型エージェントの最適化 Algothythm behind Gemini Enterprise Agent Designer

DS-STAR: データサイエンスにおける反復的計画対象: 異種フォーマットを含む複数データソースの分析。前提: 正解ラベルがなく、実行結果のみで計画を評価できない。手法:

MLE-STAR: MLエンジニアリングの局所的洗練対象: Kaggle等での機械学習パイプライン構築。前提: LLMは学習データに依存し、古い手法に偏る傾向がある。手法:

PlanGEN: 推論アルゴリズムの動的選択対象: カレンダー調整や数理・金融推論など、複雑な計画立案。前提: タスクの難易度は異なり、単一の推論手法では対応不可。手法:

3. Automated Design & Scaling: MASの自動設計とスケーリング則 Algothythm behind Gemini

MASS: プロンプトとトポロジーの段階的最適化対象: 推論やコーディング等の一般的なマルチエージェント協調。前提: 性能はプロンプトの質と接続構造（トポロジー）に極めて敏感。手法:

Heterogeneous Swarms: ロールと重みの結合最適化対象: エージェントによる協調生成（Collaborative generation）。前提: 異なる専門性を持つ複数のLLM

Scaling Agent Systems (1/2): タスク依存性対象: 環境との継続的なインタラクションを伴うAgenticなタスク。前提: タスクの依存関係（並列か直列か）が

Scaling Agent Systems (2/2): スケーリングの限界ツールの代償: ツール呼び出しが多いタスクは単一エージェントが有利。能力の飽和: 基礎性能が約45%を超え

4. Synthesis & Guidelines: 実践的な設計指針 Algothythm behind Gemini Enterprise Agent

サーベイからの客観的結論と設計指針 1. トポロジーより個のプロンプトを優先せよ (MASS, PlanGEN) 複雑なグラフ構造を組む前に、個別のプロンプトを徹底的に最適化する。 2. タスクの分割可能性を見極めよ (Scaling Agent