Slide 1

Slide 1 text

AI エージェントは何に使うべきか エージェント周りの分類の整理と利用すべき場面 CAIO 下垣内 隆太 Building a Future Where Humanity and AI Co-Evolve Through the Democratization of Cyberspace 株式会社 Elith

Slide 2

Slide 2 text

自己紹介 : @eta1ia : aRySt0cat 神戸市立工業高等専門学校 ← 3DCNN, 動画分類 東京大学 工学部 ← 非平衡熱力学 東京大学大学院 情報理工学系研究科 ← 拡散モデル, 最適輸送 ~4才 大阪 4~12才 上海・大連 12才~20才 兵庫 20才~ 東京 CAIO / Generative AI Research Engineer 下垣内 隆太 2

Slide 3

Slide 3 text

Elith • CEO / CTO: 井上 顧基 • 創業: 2022年12月 • 医療・HR・建築・自動車・エネルギー系など様々な分野での AI 開発 • 研究も行う: • AAPM 米国医療物理学会 • ITSC 高度交通システム学会 • CVPR 画像映像関連AI学会 • ASJ 日本音響学会 • JSAI 人工知能学会 Elith ってどんな会社? 3 elith.co.jp

Slide 4

Slide 4 text

宣伝 『やさしく学ぶLLMエージェント:基本からマルチエージェント構築まで』 本を書きました。 4 出版記念イベント with からあげさん: 面倒なことはChatGPTにやらせよう 冨山さん: Polarsとpandasで学ぶデータ処理アイデアレシピ55 西見さん: LangChainとLangGraphによるRAG・AIエージェント[実践]入門 Amazon https://amzn.asia/d/biJOhq8

Slide 5

Slide 5 text

LLM を使ったシステムの 4 段階 1. LLM 利用 LLM を Text to Text の単一の機能として利用する。 2. LLM ワークフロー LLM を決まった手順で複数回用いて目標を達成する。 「やること」を定義する。 3. シングルエージェント LLM が自己判断でツール等を利用しながら可変な手順で目標を達成する。 「できること」を定義する 4. マルチエージェント エージェントが、自律的なエージェントをツールとして利用しながら目標を達成する。 メモリや知識、利用可能なツールによってエージェント間が区別される。 5 そもそも エージェント って何?

Slide 6

Slide 6 text

LLM を使ったシステムの 4 段階 1. LLM 利用 • 翻訳・スタイル変換 • Structured Output による情報の構造化 6 Colorless green ideas sleep furiously 2025年2月19日、WeWork 東京ス クエアガーデンで、AIエージェ ントLT会が開催されました。 このイベントは18:00に始まり、 150名の人が集まりました。 { “date”: 2025-02-19, “place”: “WeWork 東京スクエアガーデン”, “title”: “AIエージェントLT会”, ”start”: ”18:00”, “visitors”: 150 } 無色の緑の考えが猛烈に眠る

Slide 7

Slide 7 text

LLM を使ったシステムの 4 段階 2. LLM ワークフロー 7 ステップ Aをして Bをして … 事前に定義

Slide 8

Slide 8 text

LLM を使ったシステムの 4 段階 3. シングルエージェント 8 ステップ LLM が次の行動を選択

Slide 9

Slide 9 text

LLM を使ったシステムの 4 段階 4. マルチエージェント 9 ステップ 他のエージェント利用が ツールの1つとして加わる

Slide 10

Slide 10 text

ワークフローとエージェント 10 メリットデメリット ワークフロー エージェント 進捗率が分かる ドメイン知識やノウハウを入れやすい Dify/LangChain/LangGraph などで簡 単 に実装できる フローを作れる程度の知見が必要 目標達成せずに終わる可能性がある いつ終わるかわからない LLM の自己判断でメチャクチャな方向 に脱線してしまう場合もある 「できること」を定義すればよく、 「やり方」に関する知見は必要ない 必要に応じて時間をかけてでも目標達成 に向けて動いてくれる

Slide 11

Slide 11 text

エージェントは何に使うべきか 11 チェックリスト  単発の推論では解決が難しい/複数のサブタスクを伴う  様々なツール利用を伴う  タスクの中間出力に基づく、自己判断が必要  インタラクションする環境の変動が大きく、適応的な処理が必要  成果物の基準が明示的でなく、発散するようなアウトプットが欲しい エージェントの運用  複雑なエージェント設計・デバッグ、メンテナンスの工数や技術リソースを投入できる  自律性ゆえに予測が難しい挙動やリスクを、適切な検証・モニタリング体制で補える ワークフローでOK

Slide 12

Slide 12 text

エージェントは何で作るべきか 12 エージェント周りのフレームワークありすぎる フレームワーク 特徴 強み 弱み LangChain/LangGraph 包括的なフレームワーク。 LangGraph によりループを 含む複雑なフローの制御が可 能 監視用の LangSmith, デプロイ用の Platform なども提供されており全て完結 する。また、community として様々な外 部ツール・LLM等との連携を提供 ライブラリのコードを読まないと、 カスタマイズ方法が把握できない場 合がある。 AutoGen マルチエージェントのための フレームワーク。 マルチエージェントに関して必要な機能 が提供されつつ、実装をシンプルに保つ ことができる。 デバッグ時のリプレイ機能等はな い? → AgentOps 等を利用すれば問題 ない LlamaIndex RAG ベースのエージェント を実装する際に便利。 LangChain よりもシンプル に実装できる場合も多い。 軽量化つシンプルで、RAG に関する十分 な機能が提供されている。 複雑なカスタマイズや、エージェン ト作成には向かない。 MetaGPT SOP (Standard Operating Procedure) によって連携す るマルチエージェントを構築 するフレームワーク。 ソフトウェア開発を行うマルチエージェ ントシステム構築に強い? 学習難易度が高い。コミットログが たまに中国語。 Pydantic AI 他のライブラリでもツール定 義に利用される pydantic が 開発。pydantic-graph も公 開。 型安全でデバッグしやすい。エージェン トの構築が容易で、拡張性もある。 まだ v0.0.24 で、バージョンアップ による破壊的変更が多そう。エー ジェント構築のための機能はまだ十 分ではない。

Slide 13

Slide 13 text

宣伝 『やさしく学ぶLLMエージェント:基本からマルチエージェント構築まで』 本を書きました。 13 出版記念イベント with からあげさん: 面倒なことはChatGPTにやらせよう 冨山さん: Polarsとpandasで学ぶデータ処理アイデアレシピ55 西見さん: LangChainとLangGraphによるRAG・AIエージェント[実践]入門 Amazon https://amzn.asia/d/biJOhq8