デザインパターンで理解するLLMエージェントの作り方 / How to develop an LLM agent using agentic design patterns

by r-kagaya

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

© 2024 Loglass Inc. 2 今日の内容 ● 話すこと ○ LLMエージェント、Agentic Workflowの設計パターン ■ 特にAgentic Design Pattern ○ 関連事例/リソース紹介 ● 話さないこと ○ AI/LLMエージェント、Agentic Workflowの概要、定義の詳細 ○ 特定言語 / フレームワークでの実装言語・フレームワークレベルでの実装ではなく、LLMエージェント、Agenticワークフローを作る上で参考になる抽象的な構造について言及します

Slide 4

Slide 4 text

Slide 5

Slide 5 text

© 2024 Loglass Inc. 4 単一のプロンプトからAgenticなワークフローへ ● 一回のプロンプト実行（Non-Agentic）での出力品質の制約 ○ 複雑なタスクへの対応の難しさ ● LLMが反復的、段階的にタスクをこなすAgenticワークフローへ ● Agentic ≒ 設定された目標に向かって、より自律的に行動しタスクがこなせる度合い ● Agenticなワークフローの効果 ○ HumanEval(コーディングベンチマーク)による検証 ■ GPT-3.5 ゼロショット: 48.1% ■ GPT-4 ゼロショット: 67.0% ■ GPT-3.5 Agenticワークフロー: 95.1% ● 補足: fews shotも強力

Slide 6

Slide 6 text

© 2024 Loglass Inc. 5 ● 自然な表現に修正 ● 文法,語彙,構文を改善 ● 翻訳言語らしい表現に調整翻訳プロセスを「事前調査」「ドラフト」「リファインメント」「校正」の4段階に分解 Zero-shot翻訳と比較して、各ステップで翻訳品質が段階的に向上 ● 事前調査を基に下訳を作成 ● 正確性重視 ● 原文の意味を忠実に反映翻訳タスクを複数のステップでこなすことで品質が上がる Translating Step-by-Step: Decomposing the Translation Process for Improved Translation Quality of Long-Form Texts 事前調査ドラフトリファインメント校正 ● 原文の慣用句や比喩表現を特定 ● 課題の事前把握 ● 翻訳戦略を立案 ● 最終チェック ● 誤字脱字の修正 ● 文法的誤りの確認 ● 正確性と流暢さの最終確認

Slide 7

Slide 7 text

© 2024 Loglass Inc. 6 Agentic Workflow == LLMが反復的、段階的、自律的にタスクをこなすプロンプト一回でタスクをこなすのではなく、タスクの分解、「〇〇を修正して」というフィードバックの提供等を反復的に行った方が求めた出力に近づく可能性は高くなるプロンプトを与えて一度で出力を生成 ≒ ゼロショット一度で出力生成を完結させず、LLMが反復的にタスクをこなしながら、出力を改善 ≒ LLMエージェント、フローエンジニアリング Non Agentic Workflow Agentic Workflow

Slide 8

Slide 8 text

© 2024 Loglass Inc. 7 Agentic Workflow == LLMが反復的、段階的、自律的にタスクをこなすプロンプト一回でタスクをこなすのではなく、タスクの分解、「〇〇を修正して」というフィードバックの提供等を反復的に行った方が求めた出力に近づく可能性は高くなるプロンプトを与えて一度で出力を生成 ≒ ゼロショット一度で出力生成を完結させず、LLMが反復的にタスクをこなしながら、出力を改善 ≒ LLMエージェント、フローエンジニアリング Non Agentic Workflow Agentic Workflow -> 複数のLLM推論、not AIなプログラムをどう組み合わせ、処理を作るか

Slide 9

Slide 9 text

© 2024 Loglass Inc. 8 ● 自然な表現に修正 ● 文法,語彙,構文を改善 ● 翻訳言語らしい表現に調整翻訳プロセスを「事前調査」「ドラフト」「リファインメント」「校正」の4段階に分解 Zero-shot翻訳と比較して、各ステップで翻訳品質が段階的に向上 ● 事前調査を基に下訳を作成 ● 正確性重視 ● 原文の意味を忠実に反映（再掲）翻訳タスクを複数のステップでこなすことで品質が上がる Translating Step-by-Step: Decomposing the Translation Process for Improved Translation Quality of Long-Form Texts 事前調査ドラフトリファインメント校正 ● 原文の慣用句や比喩表現を特定 ● 課題の事前把握 ● 翻訳戦略を立案 ● 最終チェック ● 誤字脱字の修正 ● 文法的誤りの確認 ● 正確性と流暢さの最終確認

Slide 10

Slide 10 text

© 2024 Loglass Inc. 9 ● 自然な表現に修正 ● 文法,語彙,構文を改善 ● 翻訳言語らしい表現に調整翻訳プロセスを「事前調査」「ドラフト」「リファインメント」「校正」の4段階に分解 Zero-shot翻訳と比較して、各ステップで翻訳品質が段階的に向上 ● 事前調査を基に下訳を作成 ● 正確性重視 ● 原文の意味を忠実に反映（再掲）翻訳タスクを複数のステップでこなすことで品質が上がる Translating Step-by-Step: Decomposing the Translation Process for Improved Translation Quality of Long-Form Texts 事前調査ドラフトリファインメント校正 ● 原文の慣用句や比喩表現を特定 ● 課題の事前把握 ● 翻訳戦略を立案 ● 最終チェック ● 誤字脱字の修正 ● 文法的誤りの確認 ● 正確性と流暢さの最終確認翻訳を段階的に行う LLMワークフローで翻訳品質が向上

Slide 11

Slide 11 text

© 2024 Loglass Inc. 10 LLMエージェントデザインパターンの意義モデルやツールの進化に依存しない共通パターンを理解する ● モデルやツールの状況は日進月歩で変化している ● 半年前はGPT-4o miniも、LangGraphも存在していない ● 抽象的な共通パターンの理解は比較的長期で適用可能な知見 ● 直近のLLMエージェントの研究/実装も、本スライドで紹介するAgentic Design Patternで捉えることで理解を深めるなど

Slide 12

Slide 12 text

Slide 13

Slide 13 text

© 2024 Loglass Inc. 12 Agentic Workflow / LLMエージェント構築の4つのデザインパターン ● Andrew Ng氏が提唱 ● Agentic Workflow / LLMエージェントに共通で見られるパターン、構造を整理 ● Reflection、Tool Use、Planning、Multi-agent collaborationの4つに分類 Reflection Tool Use Multi-agent Planning

Slide 14

Slide 14 text

Slide 15

Slide 15 text

© 2024 Loglass Inc. 14 Reflectionの実装例 ● 良質なフィードバックを生成できるか、フィードバックを改善に繋げられるか名称アプローチ特徴 Self-Refine 単一LLMによる自己改善の反復的プロセス ● 自身の出力に対するフィードバック生成 ● フィードバックに基づく出力の改善 ● 単一モデルで完結する設計 Reflexion メモリーと自己反省機能を活用した改善プロセス ● 言語的フィードバックの生成 ● 長期記憶への保存機能 ● 次回試行での改善に活用 CRITIC 外部ツールとの対話による検証・改善サイクル ● 外部ツールとの連携による検証 ● LLM単体の限界を補完 ● 多角的な出力評価が可能紹介する事例・研究は Agentic Design Pattern登場当時に言及されていた、少し昔の研究・実装

Slide 16

Slide 16 text

Slide 17

Slide 17 text

© 2024 Loglass Inc. 16 Tool Useの実装例 ● 何のツールを選定して、どのLLMにどのツールを、いつ使わせるか名称アプローチ特徴 Toolformer APIコール生成の自己学習 Few-shotベースの学習 ● API呼び出しのタイミング学習 ● 適切な引数の自動生成 ● 有用なAPIコールの選別 Gorilla APIコールに特化検索システムとの連携 ● 高精度なAPI選択 ● 適切なコード生成 ● APIドキュメント更新対応 ● GPT-4超えの精度実現紹介する事例・研究は Agentic Design Pattern登場当時に言及されていた、少し昔の研究・実装

Slide 18

Slide 18 text

Slide 19

Slide 19 text

© 2024 Loglass Inc. 18 Planningの実装例 ● 計画立案を自律的に行えば行うほど複雑度が増し、コントロールが難しい側面も名称アプローチ特徴 Plan-and-S olve Plan段階でのタスク分割 Solve段階での順次実行 ● 2段階プロンプティング ● 段階的な問題解決 HuggingG PT 複数モデルの連携タスク依存関係の分析 ● 最適モデルの選択 ● 複雑タスクの分解 BabyAGI マルチエージェント方式反復的なタスク生成 ● タスク優先順位付け ● 動的なタスク管理紹介する事例・研究は Agentic Design Pattern登場当時に言及されていた、少し昔の研究・実装

Slide 20

Slide 20 text

Slide 21

Slide 21 text

© 2024 Loglass Inc. 20 Multi-agent collaborationの実装例 ● 役割分担とエージェント間のコミュニケーション設計名称アプローチ特徴 ChatDev 開発プロセスに特化 Chat Chainによる対話型協調フェーズごとの役割分担 ● ロール別マルチエージェント ● CEO、CTO、プログラマー、テスター MetaGPT SOPsベースの協調 Pub/Subメカニズム役割別スキーマ定義 ● 専門的役割を持つエージェント群 ● 標準化された作業手順 ● フィードバックメカニズム API-Bank 段階的データ生成専門エージェントの連携品質チェック機能 ● ドメインエージェント ● APIエージェント ● クエリ/実行エージェント ● テストエージェント紹介する事例・研究は Agentic Design Pattern登場当時に言及されていた、少し昔の研究・実装

Slide 22

Slide 22 text

© 2024 Loglass Inc. 21 Agentic Design Patternの使い方 ● 登場直後はOSS/論文でも1,2つ程度のパターンが確認できるものが多かった印象 ● 今となってはこの4つだけでは分類/整理しきれない ○ 濃淡はあれどAgentic Design Patternが確認できない方が珍しい（感想） ● シンプルな形でも使いやすいのはReflection、Tool Use ● Planningは強力だが、初手から意図せず挙動を生み出す可能性も高い ● Multi Agentはエージェント数、役割分担の差配で制御の難易度が変化 ○ エージェント間の連携方法にも設計差分が生まれる印象 ■ 単に出力をそのまま渡すのではなく、YAML,XMLを用いて独自仕様の構造化ドキュメント、pub-subに近い仕組みの導入 ■ LangChainが公開したAgent Protocolのように標準仕様の登場の可能性も

Slide 23

Slide 23 text

Slide 24

Slide 24 text

© 2024 Loglass Inc. 23 Sakana.aiのAIサイエンティスト ● アイデア創出から論文執筆まで自動化 ● 1論文あたり約15ドルで生成可能 ● アイディア生成、実験、論文執筆の3フェーズ Idea Generation（アイデア生成） ● LLMによるアイデア・計画の革新 ● Semantic Scholarによる新規性確認 ● アイデアのスコアリングとアーカイブ Experiment Iteration（実験実行） ● 実験テンプレートの活用 ● LLM & aiderによるコード生成 ● 実験の実行と結果収集、反復 Paper Write-Up（論文執筆） ● 論文テンプレートの活用 ● 論文の執筆と改訂 ● LLMによる論文レビュー「AIサイエンティスト」： AIが自ら研究する時代へ

Slide 25

Slide 25 text

© 2024 Loglass Inc. 24 Sakana.aiのAIサイエンティストに見るAgentic Design Pattern デザインパターン毎にざっくり見てみる ● 研究アイデアの自己評価 ● 実験結果の分析と改善提案 ● 論文の品質チェックと修正 ● Semantic Scholar APIによる文献調査 ● Aiderによるコード生成と実行 ● LaTeXコンパイラの活用 ● 研究計画の段階的な立案 ● 実験の優先順位付け ● 執筆者と査読者の役割分担 ● 複数の視点からの品質評価 Reflection Tool Use Planning Multi-Agent 「AIサイエンティスト」： AIが自ら研究する時代へ

Slide 26

Slide 26 text

© 2024 Loglass Inc. 25 Sakana.aiのAIサイエンティストに見るAgentic Design Pattern フェーズ毎にざっくり見てみる ● Reflection: アイデアの自己評価 ● Tool Use: Semantic Scholar APIの活用 ● Planning: 研究計画の立案と検証 ● Tool Use: Aiderによるコード生成と実行 ● Reflection: 実験結果の分析と改善 ● Planning: 実験の優先順位付け ● Multi-Agent: 執筆者と査読者の分離 ● Reflection: 論文の品質チェック ● Tool Use: LaTeXコンパイラの活用 Idea Generation Experiment Iteration Paper Write-Up 「AIサイエンティスト」： AIが自ら研究する時代へ

Slide 27

Slide 27 text

© 2024 Loglass Inc. 26 Sakana.aiのAIサイエンティストに見るAgentic Design Pattern デザインパターンの組み合わせ結果の分析に基づく計画の改善: 実験結果を振り返り、次のステップを効率的に計画する Reflection + Planning ツールを活用した役割の分担と連携: 各エージェントが専門ツールを活用し、より高度な作業をこなす Tool Use + Multi-Agent 複数エージェントによる効率的な実行: 実験・執筆・レビューの各フェーズを専門エージェントが担当エージェント間の連携を考慮した実行計画 Planning + Multi-Agent 「AIサイエンティスト」： AIが自ら研究する時代へ

Slide 28

Slide 28 text

© 2024 Loglass Inc. 27 MicrosoftのMagentic-One マルチエージェントの協調による複雑なタスクの解決汎用的な問題解決能力を持つチームベースアプローチリーダーエージェントによるタスク分析エージェント構成の決定実行計画の立案とリソース配分 Task Planning Task Execution Result Integration 専門エージェントによる並列処理エージェント間の協調と情報共有進捗モニタリングと計画調整各エージェントの結果統合品質評価と最適化最終アウトプットの生成 Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

© 2024 Loglass Inc. 31 AFlow: Automating Agentic Workflow Generation ● モンテカルロ木探索を用いてLLMワークフローの自動生成 ● コードで表現されたノードとエッジ、オペレーターで構成 ○ オペレーター: 事前定義されたノードの組み合わせ。一般的なエージェント操作 (例: アンサンブル、レビュー) をカプセル化 -> AIエージェントを生成するAIエージェント、 Automated Design of Agentic Systemsも AFlow: Automating Agentic Workflow Generation

Slide 33

Slide 33 text

© 2024 Loglass Inc. 32 Agent as a Judge ● LLM as a Judgeに着想を得た、Agentを評価するAgentの提案 ● 「LLM-as-a-Judgeよりも優れたパフォーマンスを発揮し、人間の評価ベースラインと同等の信頼性があることを確認」 -> LLM as a JudgeのLLM部分を、Agenticに作ればもっと性能が良くなるのではない？ Agent-as-a-Judge: Evaluate Agents with Agents

Slide 34

Slide 34 text

Slide 35

Slide 35 text

© 2024 Loglass Inc. 34 まとめ ● 細かな名称/定義は違えど、単一のプロンプトではなく、Agenticなワークフローを用いるケースは、これからもさらに増加するだろう ● LLMエージェント、Agentic Workflowのデザインパターンとして、Agentic Design Patternを紹介 ○ 別のパターンや学習コンテンツも紹介 ● 言語/フレームワークに依存しないため、組み合わせ、設計を考える際の参考に ● Agentic Workflowの自動生成/チューニングも濃淡はあれど遅かれ早かれやってくる ○ 評価/データセットの整備はその時にも生きそう

Slide 36

Slide 36 text

© 2024 Loglass Inc. 35 Appendix ● LangChain - Agent architectures ● Large Language Model-Based Agents for Software Engineering: A Survey ○ ソフトウェアエンジニアリング領域のLLMエージェントの研究のサーベイ ● LLMエージェントのデザインパターン、Agentic Design Patternsを理解する ○ 本スライドの元となった記事