Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLMベースマルチエージェントシステム 〜 協調メカニズムに関するサーベイ 〜 A Sur...

LLMベースマルチエージェントシステム 〜 協調メカニズムに関するサーベイ 〜 A Survey of Coordination Mechanisms in LLM-based Multi-Agent Systems

Avatar for Neurogica

Neurogica

April 09, 2026

More Decks by Neurogica

Other Decks in Technology

Transcript

  1. - 単⼀LLMの限界: - ChatGPTのような単⼀のLLMは⾮常に強⼒だが,「複雑なタスクの処理」「ハルシ ネーション」といった本質的な限界に直⾯している. - 解決策としてのマルチエージェントシステム (MAS) - 複数のLLM

    (エージェント) が協調することで,単体の限界を乗り越えより複雑で信 頼性の⾼いタスクを実⾏できる「集合知」の実現を⽬指す. はじめに: なぜマルチエージェントが必要なのか? @Neurogica Inc. はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ
  2. 1. マルチエージェントシステム (MAS) の全体像 a. MASとは? LLMエージェントの構成要素 2. 【技術詳細】エージェントの協調の仕組み a.

    タイプ b. 構造 c. 戦略 d. プロトコル 3. 【応⽤事例】 a. 経済 (EconGrowthAgent) ,⾦融 (HedgeAgent) 4. 課題 5. まとめ アジェンダ はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ
  3. - コンセプト: LLMをエージェントの「脳」として活⽤する. - エージェントの主な構成要素: - LLM (脳) : 中核となる推論エンジン

    - 知覚モジュール: 環境からの⼊⼒ (テキスト,データなど) を処理 - アクションモジュール: 実⾏し,外部環境に働きかける - アダプター: LLMを外部ツール (Web検索,API,社内DBなど) に接続する MASの全体像: LLMベースのエージェントの構成 はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ これらの要素を持つエージェントが複数集まり,協調することで, 単体では解決できないタスクに挑む.
  4. • タイプ: ◦ エージェント間の関係性 • 構造: ◦ 情報伝達の組織構造 • 戦略:

    ◦ 各エージェントの⾏動⽅針 • プロトコル: ◦ 具体的な通信やタスクの引継ぎ⼿順 MASの全体像: 協調のためのフレームワーク はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ
  5. • ⽬的: システム全体でのアウトプット最⼤化 • 例: 学術論⽂執筆⽀援 ◦ 「編集者」「研究者」「翻訳者」「検証者」と いった専⾨的な役割を持つエージェントが,それぞ れのタスクを分担・遂⾏し,⼀つの⾼品質な論⽂を

    完成させる. 協調のタイプ①: 協⼒ (Cooperation) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 複数のエージェントが,共通の⽬標達成のために連携し,それぞれの専⾨性を    活かして相互に補完しあう関係性
  6. • ⽬的: 競争を通じ,より優れた戦略や解決策を⽣み出す • 例: 法廷シミュレーション ◦ 「検察官」エージェントと「弁護⼈」エージェントが, それぞれの主張の正当性を⽰すために議論を戦わせる. この対⽴的な相互作⽤が,より深く多⾓的な結論を導き

    出す. 協調のタイプ②: 競争 (Competition) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 各エージェントが,⾃⾝の個別⽬標の達成を最優先する関係性.⽬標が対⽴ する場合,エージェントは互いに競い合う.
  7. • ⽬的: 個々の利益と全体の利益のバランスを取りなが ら,イノベーションを促進する. • 例: 政策⽴案 ◦ 複数の「政策担当」エージェントが,⾃らの政策案の優 位性を競いながらも「より良い政策を作る」という共通

    の⽬標のために情報共有等の協⼒を⾏う 協調のタイプ③: 協調競争 (Coopetiton) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 「協⼒」と「競争」の要素を組み合わせたハイブリッドな関係性.ある側⾯ では協⼒し,別の側⾯では競争する.
  8. • 特徴: ◦ メリット: 調整がシンプルで,意思決定が速い ◦ デメリット: 中央エージェントがボトルネックや単⼀障害点になるリスク有り • 例:

    FedIT (Federated Learning) ◦ 各エージェント (クライアント) の学習結果を,中央のサーバーが集約して全体のモデルを更新 Towards Building the Federated GPT: Federated Instruction Tuning (ICASSP 2024) https://arxiv.org/abs/2305.05644 協調の構造①: 中央集権型 (Centralized) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 単⼀の「中央エージェント」または「アグリゲーター」がハブとなり, 他の全てのエージェントの活動を調整・管理する通信構造.
  9. • 特徴: ◦ メリット: 単⼀障害点がなく堅牢.柔軟で適 応的な相互作⽤が可能 ◦ デメリット: 全体の合意形成が複雑になり, 通信オーバーヘッドが増加する可能性有り

    • 例: AgentCF (Collaborative Filtering) ◦ 「ユーザー」エージェントと「アイテム」エージェントが直接対話し ,⾃律的に嗜好を探りながら推薦を⾏う. AgentCF: Collaborative Learning with Autonomous Language Agents for Recommender Systems (WWW 2024) https://dl.acm.org/doi/10.1145/3589334.3645537 協調の構造②: 分散型 (Decentralized) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 中央の管理者を置かず,各エージェントがピアツーピア (P2P) で 直接相互作⽤する通信構造.
  10. • 特徴: ◦ メリット: ⼤規模なタスクを分解して効率的に管理可能.中央集権と分散実⾏のバランスが取れる ◦ デメリット: 階層が深くなると,情報伝達に遅延が⽣じる可能性有り • 例:

    CAMEL ◦ ユーザーの指⽰を拡張するエージェント,それ を評価・選択するエージェント,アシスタントと して実⾏するエージェントが階層的に連携 協調の構造③: 階層型 (Hierarchical) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: エージェントを複数のレベル (階層) に編成し,上位のエージェントが下位の エージェントの活動を調整する通信構造. CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Society (NeurIPS 2023) https://openreview.net/forum?id=3IyL2XWDkG
  11. • 特徴: ◦ メリット: ⾏動が予測可能で,実装やデバッグが⽐較的容易 ◦ デメリット: 未知の状況に対する柔軟性や適応性に⽋ける • 例:

    多数決 ◦ 複数のエージェントが提⽰した意⾒の中から,最も多くの ⽀持を得たものを最終的な結論として採⽤する,という明 確なルールに従う. 協調の戦略①: ルールベース (Rule-based) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 「IF-THEN」形式のような,事前に定義された厳密なルールやプロトコルに 基づいてエージェントが⾏動する戦略.
  12. • 特徴: ◦ メリット: 専⾨性を活かした分業により,複雑なタスクを効率的に処理可能 ◦ デメリット: 役割分担が固定的なため,柔軟性に⽋ける場合有り • 例:

    ソフトウェア開発 (MetaGPT, ChatDev) ◦ 「プロダクトマネージャー」「開発者」「品質保証」と いった役割をエージェントに与え,それぞれの専⾨業務を 遂⾏させる 協調の戦略②: ロールベース (Role-based) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 各エージェントに特定の役割 (Role) と責任を割り当て,その役割に特化した ⾏動を取らせる戦略. MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework (ICLR 2024) https://openreview.net/forum?id=VtmBAGCN7o ChatDev: Communicative Agents for Software Development (ACL 2024) https://aclanthology.org/2024.acl-long.810/
  13. • 特徴: ◦ メリット: 他者の⾏動を予測できるため,より適応的で洗練された相互作⽤が可能. ◦ デメリット: 他者のモデル化は複雑で,計算コストが⾼くなる可能性がある. • 例:

    ゲームプレイ ◦ 対戦相⼿の次の⼿を予測し,それに応じて⾃⾝の 戦略を動的に変更 協調の戦略③: モデルベース (Model-based) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 他のエージェントの知識,信念,⾏動などをモデル化 (推測) し, そのモデルに基づいて⾃⾝の最適な⾏動を確率的に決定する戦略.
  14. • これまでの「タイプ」「構造」「戦略」が協調の静的な設計であるのに対し, プロトコルは実際の相互作⽤を司る動的な側⾯を定義 • ⽬的と重要性: ◦ 秩序の維持: ▪ エージェントの無秩序な対話や処理の衝突を防ぐ. ◦

    効率性の向上: ▪ 不要な通信を削減することで,システム全体の処理効率を⾼める. ◦ タスクの継続性: ▪ 複数のエージェントが関わる複雑なタスクにおいて,情報の⽋落なく 処理を引き継ぐことを保証する. 協調プロトコル はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: エージェント間の相互作⽤を円滑に進めるための,通信⼿順やルールの集合.
  15. • 特徴: ◦ 情報伝達の意図が明確で,誤解が⽣じにくい. ◦ 複雑な交渉や合意形成,ディベートなど,深い対話が必要なタスクに適している. • 例 ◦ 質問応答システムにおいて,「⽀持派」と「反対派」のエージェントが互いの意⾒

    ◦ に対して直接反論し,議論を深めることで,より多⾓的で精度の⾼い回答を⽣成する. 協調プロトコル①: 直接コミュニケーション はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: エージェント間で,メッセージ (テキスト,データ,APIコールなど) を 明⽰的に交換する⽅式.
  16. • 特徴: ◦ 通信オーバーヘッドが少なく,エージェント数が多い⼤規模なシステムでもスケールしやすい. ◦ 創発的 (予期せぬ) な協調⾏動が⽣まれやすい. • 技術的な例

    ◦ あるエージェントが分析結果を共有データベースに書き込み,別のエージェントがその書き込み をトリガーとして次の処理を開始する. 協調プロトコル②: 間接コミュニケーション はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 直接的なメッセージ交換ではなく,共有された環境 (データベース,物理空間 など) の状態を変化させ,それを他のエージェントが観測することで協調する⽅式
  17. • ⽬的と特徴: ◦ 継続性の維持: ▪ 複数のステップから成るタスクを,情報や状態を失うことなくシームレスに継続させる. ◦ 専⾨性の活⽤: ▪ 各ステップに最も適した専⾨エージェントにタスクを割り当てることで,システム全体の品質

    と効率を向上させる. ◦ 明確な基準: ▪ 「いつ,どのような条件で」タスクを引き継ぐかの基準を明確に定義する必要がある. 協調プロトコル③: ハンドオフメカニズム (1) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: あるエージェントが担当していたタスクを,別の専⾨性を持つエージェントへ 制御とコンテキスト (⽂脈情報) ごと引き継ぐためのプロトコル.
  18. 例: eコマースの顧客対応 1. Triage Agent (初期対応) : - ユーザーからの問い合わせ -

    (例:「⿊いブーツを注⽂したい」) を受け,その意図 (販売か,返⾦か) を判断する. 2. Handoff: - 意図が「販売」と判断されたら,タスクをSales Agent (販売担当) に引き継ぐ. 3. Handoff: - ユーザーが「返⾦したい」と⾔い直せば,タスクはRefund Agent (返⾦担当) に引き継がれる. 協調プロトコル③: ハンドオフメカニズム (2) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ
  19. • ⼀般社会を模倣するLLMエージェントを⽤いたマクロ経済シミュレーション • GPT-4oエージェント100体を⽤い,20年間にわたり経済を分析 • 家計 (消費者) エージェント ◦ 賃⾦を上げると労働意欲が増す

    ◦ 貯⾦が増えるにつれて労働意欲が低下 ◦ 財の価格が上がると,購⼊数を減らす • 企業エージェント ◦ 需要>供給なら価格をつり上げる (逆は逆) ◦ より需要が⼤きい財に⽣産をシフト ◦ 売り上げに応じて賃⾦を改定 ◦ ⽣産拡⼤のため,継続的に研究開発及び ◦ ⽣産設備に投資 【応⽤事例】①EconGrowthAgent (1) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ EconGrowthAgent: LLM エージェントと経済成⻑理論に基づくマクロ経済シミュレーション (JSAI 2025) https://www.jstage.jst.go.jp/article/pjsai/JSAI2025/0/JSAI2025_1Win4105/_pdf/-char/ja
  20. • どんな国の経済成⻑が速いか? ◦ 倹約家の国 >> 浪費家の国 浪費家の国の家計は貯⾦率が低い ➡お⾦を⼤量に消費財購⼊に ➡企業は消費財⽣産を増やす ➡代わりに資本財

    (⽣産設備) が減る ➡資本財の価格が⾼騰 ➡企業が資本財を変えないので⽣産が減る • 反実仮想シミュレーション「地球滅亡クラスの隕⽯接近の予報」 ◦ 家計LLM ▪ 仕事をやめて,お⾦をたくさん使う ◦ 企業LLM ▪ ⻑期投資を捨てて, 全てのリソースを消費財⽣産へ 【応⽤事例】①EconGrowthAgent (2) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ
  21. • Bitcoin,株,為替それぞれを担当する専⾨エージェントと 1つの統括エージェントで構成 • 3つの会議を開催して資産の決定及びエージェントの能⼒向上 ◦ 予算分配会議 (毎⽉開催) ◦ 経験共有会議

    (各投資サイクル終了時開催) ◦ 極端市場会議 (緊急時に開催) • 反省とヘッジ戦略に基づいて,⼤きな価格変動が起きても 損失を出しにくい⾃動取引⼿法が実現 【応⽤事例】②HedgeAgents (1) はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ 定義: 複数のLLMエージェントを⽤いた反省とヘッジ戦略に基づく⾃動取引⼿法 HedgeAgents: A Balanced-aware Multi-agent Financial Trading System (WWW 2025) https://arxiv.org/abs/2502.13165
  22. 課題 はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ • 技術的な課題

    ◦ ハルシネーションの増幅: ▪ ⼀つのエージェントの誤情報が,他のエージェントに伝播・強化されてしまうリスク. ◦ スケーラビリティ: ▪ エージェント数が増えた際の計算コストや通信オーバーヘッドの問題. • 評価の課題: ◦ 標準化された指標の⽋如: ▪ 個々の性能だけでなく「協調の質」そのものを客観的に評価する統⼀的な ベンチマークがまだ存在しない.
  23. まとめ はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ • なぜマルチエージェントにするのか?

    ◦ 単⼀LLMの限界 (複雑なタスクの処理等) を,複数のエージェントによる「集合知」で乗り越 えるため. • どうやって協調させるのか? ◦ タスクに応じて,協調の「タイプ」「構造」「戦略」「プロトコル」を組み合わせ最適な「協 調メカニズム」を設計する. • 何ができるのか? ◦ EconGrowthAgentやHedgeAgentsのように,複雑な社会・経済現象のシミュレーション や⾼度な⾦融取引をはじめとした単体では不可能なタスクを実現する. • 課題 ◦ ハルシネーション増幅やスケーラビリティなどの技術的な問題や,協調の質を測る評価指標が ないという問題.
  24. 参考⽂献 はじめに アジェンダ MAS 技術詳細 応⽤事例 課題 まとめ • Khanh-Tung

    Tran, et al., “Multi-agent collaboration mechanisms: A survey of llms,” arXiv preprint arXiv:2501.06322, 2025. https://arxiv.org/abs/2501.06322 • 森下 皓⽂, et al., “EconGrowthAgent: LLM エージェントと経済成⻑理論に基づくマクロ経済シ ミュレーション,” in Proceedings of the JSAI, 2025. https://www.jstage.jst.go.jp/article/pjsai/JSAI2025/0/JSAI2025_1Win4105/_article/-c har/en • Xiangyu Li, et al., “HedgeAgents: A Balanced-aware Multi-agent Financial Trading System,” in Proceedings of the ACM on Web Conference, 2025. https://dl.acm.org/doi/10.1145/3701716.3715232