Slide 1

Slide 1 text

なぜ今 AI Agent なのか LLMアプリケーションの次なる進化 近藤憲児

Slide 2

Slide 2 text

AI Agent の定義と特徴 Agentとは 環境と対話し、データを収集し、そのデータを使用して自己決定タ スクを実行して、事前に決められた目標を達成するための ソフトウェアプログラム https://aws.amazon.com/jp/what-is/ai-agents/ 特に注目したい特徴は、 「LLMに一度だけ依頼して良い結果を得る」というアプローチではなく、 「LLMを何度も呼び出して複雑な処理を自動的に実行する」という点

Slide 3

Slide 3 text

企業の参入 ● AWS ● Microsoft ● 富士通 ● CTC ● NTTデータ ● … 注目プロダクト ● Perplexity ● GenSpark ● FeloAI ● Cursor ● Dify ● … 急速に広がる AI Agent https://jp.reuters.com/business/technology/6RXM3NLXNZOQDPY3OB7R6A77BY-2024-10-21/ https://aws.amazon.com/jp/what-is/ai-agents/ https://pr.fujitsu.com/jp/news/2024/10/23.html https://www.nttdata.com/global/ja/news/release/2024/102401/

Slide 4

Slide 4 text

OpenAI も Agent を出すらしい 急速に広がる AI Agent https://xenospectrum.com/openai-to-release-next-generation-ai-agent-operator-for-developer/

Slide 5

Slide 5 text

対象とする受講生

Slide 6

Slide 6 text

AI Agentの登場の背景の一つに、LLMに要求されるタスクの複雑化がある 例えば、カスタマーサポートタスクを考える: ● 最初は「顧客の質問への回答」という単純なタスク ● そこに「過去の類似事例の参照」「製品仕様の確認」「トラブルシュー ティングの提案」「フォローアップの必要性判断」といった要求が追加 ● → これらを一つのプロンプトで処理しようとすると、対応の正確性と 一貫性が保てない この問題に対する自然な解決策が、 タスクを分割し、それぞれを独立してLLMに任せるというアプローチ = Agent なぜ Agent か?: 複雑化するタスク

Slide 7

Slide 7 text

https://speakerdeck.com/kenjikondobai/puronputoenziniaringudeganbaranai-agentic-workflow-he-jin-teng-xian-er なぜ Agent か?: 複雑化するタスク こちらに複雑化するタスクの例を書いてます

Slide 8

Slide 8 text

なぜ Agent か?: LLM の制約 LLMの基本的な制約 ● 現在時刻を知ることができない ● Web ページにアクセスできない ● データベースにアクセスできない ● ファイルシステムを操作できない ● 外部APIを呼び出すことができない ● … 実現したいのは、これら「道具を使えるLLM」= Agent RAG(検索拡張生成)も「検索という道具を使うAgent」と捉えることができる。

Slide 9

Slide 9 text

どうやって AI Agent をつくる?

Slide 10

Slide 10 text

Agentをどうやって作る?: ReAct https://react-lm.github.io/

Slide 11

Slide 11 text

Agentをどうやって作る?: Agentic Workflow https://youtu.be/sal78ACtGTc?si=fVWCLQkgnd64bBFd

Slide 12

Slide 12 text

Andrew Ng によって提唱されたアプローチ 「一度で出力の生成を完結させるのではなく、LLMが反復的にタスクをこなし、出力を改善さ せる」という考え方を核としている ● Reflection(自己改善) ○ LLMが自身の出力を評価し改善する。推論の質を段階的に向上させる ● Tool Use(ツール活用) ○ LLMの能力を外部ツールで拡張する。APIやデータベースなど、様々なツールの統合 ● Planning(計画立案) ○ 複雑なタスクを段階的に分解する。目標達成のための戦略を立案する ● Multi-agent collaboration(協調) ○ 専門化された複数のAgentの連携。タスクの分担と統合 Agentをどうやって作る?: Agentic Workflow

Slide 13

Slide 13 text

Agentをどうやって作る?: Agent Design Pattern Catalogue

Slide 14

Slide 14 text

Agentをどうやって作る?: Agent Design Pattern Catalogue ● Yue Liu らによって提案された、 エージェントの開発を支援するための 18 の設計パターン ● 先の Agentic Workflow も包含している ● GoF(Gang of Four) の雰囲気

Slide 15

Slide 15 text

Agentをどうやって作る?: 実装フレームワーク LangGraph ● 基本的に LangChain ベース ● node と edge の概念を用いて複数の LLM の協調を管理する ● 書籍「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」では LangGraph を用いて Agent Design Pattern Catalogue で示された設計を実装す る方法が提示されている AutoGen ● Microsoft 製 ● 非同期・分散処理など、スケーラブルなアーキテクチャにこだわりを感じる Swarm ● OpenAI 製(※議論あり) ● まだ実験的

Slide 16

Slide 16 text

先進的な例: sakana.ai の AI Scientist

Slide 17

Slide 17 text

先進的な例: sakana.ai の AI Scientist 特徴的な点: ● 科学的営みの自動化という野心的な目標 ● 2040年には機械学習分野でAIが自律的に研究を進められるというビジョン ● Agentic Design Patterns の実践的な活用 ● LLMを数十〜百回も呼び出す大規模な連携 https://k-kondo-s.github.io/sakana-ai-scientist-code- analysis/ 実装の詳細まとめたので みてね

Slide 18

Slide 18 text

「AGI への架け橋」 として注目したい AI Agent