なぜ今 AI Agent なのか _近藤憲児

Slide 1

Slide 1 text

なぜ今 AI Agent なのか LLMアプリケーションの次なる進化近藤憲児

Slide 2

Slide 2 text

AI Agent の定義と特徴 Agentとは環境と対話し、データを収集し、そのデータを使用して自己決定タスクを実行して、事前に決められた目標を達成するためのソフトウェアプログラム https://aws.amazon.com/jp/what-is/ai-agents/ 特に注目したい特徴は、「LLMに一度だけ依頼して良い結果を得る」というアプローチではなく、「LLMを何度も呼び出して複雑な処理を自動的に実行する」という点

Slide 3

Slide 3 text

企業の参入 ● AWS ● Microsoft ● 富士通 ● CTC ● NTTデータ ● … 注目プロダクト ● Perplexity ● GenSpark ● FeloAI ● Cursor ● Dify ● … 急速に広がる AI Agent https://jp.reuters.com/business/technology/6RXM3NLXNZOQDPY3OB7R6A77BY-2024-10-21/ https://aws.amazon.com/jp/what-is/ai-agents/ https://pr.fujitsu.com/jp/news/2024/10/23.html https://www.nttdata.com/global/ja/news/release/2024/102401/

Slide 4

Slide 4 text

OpenAI も Agent を出すらしい急速に広がる AI Agent https://xenospectrum.com/openai-to-release-next-generation-ai-agent-operator-for-developer/

Slide 5

Slide 5 text

対象とする受講生

Slide 6

Slide 6 text

AI Agentの登場の背景の一つに、LLMに要求されるタスクの複雑化がある例えば、カスタマーサポートタスクを考える: ● 最初は「顧客の質問への回答」という単純なタスク ● そこに「過去の類似事例の参照」「製品仕様の確認」「トラブルシューティングの提案」「フォローアップの必要性判断」といった要求が追加 ● → これらを一つのプロンプトで処理しようとすると、対応の正確性と一貫性が保てないこの問題に対する自然な解決策が、タスクを分割し、それぞれを独立してLLMに任せるというアプローチ = Agent なぜ Agent か？: 複雑化するタスク

Slide 7

Slide 7 text

https://speakerdeck.com/kenjikondobai/puronputoenziniaringudeganbaranai-agentic-workflow-he-jin-teng-xian-er なぜ Agent か？: 複雑化するタスクこちらに複雑化するタスクの例を書いてます

Slide 8

Slide 8 text

なぜ Agent か？: LLM の制約 LLMの基本的な制約 ● 現在時刻を知ることができない ● Web ページにアクセスできない ● データベースにアクセスできない ● ファイルシステムを操作できない ● 外部APIを呼び出すことができない ● … 実現したいのは、これら「道具を使えるLLM」= Agent RAG（検索拡張生成）も「検索という道具を使うAgent」と捉えることができる。

Slide 9

Slide 9 text

どうやって AI Agent をつくる？

Slide 10

Slide 10 text

Agentをどうやって作る？: ReAct https://react-lm.github.io/

Slide 11

Slide 11 text

Agentをどうやって作る？: Agentic Workflow https://youtu.be/sal78ACtGTc?si=fVWCLQkgnd64bBFd

Slide 12

Slide 12 text

Andrew Ng によって提唱されたアプローチ「一度で出力の生成を完結させるのではなく、LLMが反復的にタスクをこなし、出力を改善させる」という考え方を核としている ● Reflection（自己改善） ○ LLMが自身の出力を評価し改善する。推論の質を段階的に向上させる ● Tool Use（ツール活用） ○ LLMの能力を外部ツールで拡張する。APIやデータベースなど、様々なツールの統合 ● Planning（計画立案） ○ 複雑なタスクを段階的に分解する。目標達成のための戦略を立案する ● Multi-agent collaboration（協調） ○ 専門化された複数のAgentの連携。タスクの分担と統合 Agentをどうやって作る？: Agentic Workflow

Slide 13

Slide 13 text

Agentをどうやって作る？: Agent Design Pattern Catalogue

Slide 14

Slide 14 text

Agentをどうやって作る？: Agent Design Pattern Catalogue ● Yue Liu らによって提案された、エージェントの開発を支援するための 18 の設計パターン ● 先の Agentic Workflow も包含している ● GoF(Gang of Four) の雰囲気

Slide 15

Slide 15 text

Agentをどうやって作る？: 実装フレームワーク LangGraph ● 基本的に LangChain ベース ● node と edge の概念を用いて複数の LLM の協調を管理する ● 書籍「LangChainとLangGraphによるRAG・AIエージェント［実践］入門」では LangGraph を用いて Agent Design Pattern Catalogue で示された設計を実装する方法が提示されている AutoGen ● Microsoft 製 ● 非同期・分散処理など、スケーラブルなアーキテクチャにこだわりを感じる Swarm ● OpenAI 製(※議論あり) ● まだ実験的

Slide 16

Slide 16 text

先進的な例: sakana.ai の AI Scientist

Slide 17

Slide 17 text

先進的な例: sakana.ai の AI Scientist 特徴的な点： ● 科学的営みの自動化という野心的な目標 ● 2040年には機械学習分野でAIが自律的に研究を進められるというビジョン ● Agentic Design Patterns の実践的な活用 ● LLMを数十〜百回も呼び出す大規模な連携 https://k-kondo-s.github.io/sakana-ai-scientist-code- analysis/ 実装の詳細まとめたのでみてね

Slide 18

Slide 18 text

「AGI への架け橋」として注目したい AI Agent