Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【W&B ミートアップ#19】AI エージェントは何に使うべきか - エージェント周りの分類の...

Elith
February 19, 2025
130

【W&B ミートアップ#19】AI エージェントは何に使うべきか - エージェント周りの分類の整理と利用すべき場面 -

Weights & Biases さんの W&B ミートアップ#19 in 東京「AIエージェント LT 会 - AI エージェントの最先端に迫る-」(2025年2月19日) でCAIO の下垣内が発表した資料です。

Elith

February 19, 2025
Tweet

More Decks by Elith

Transcript

  1. 自己紹介 : @eta1ia : aRySt0cat 神戸市立工業高等専門学校 ← 3DCNN, 動画分類 東京大学

    工学部 ← 非平衡熱力学 東京大学大学院 情報理工学系研究科 ← 拡散モデル, 最適輸送 ~4才 大阪 4~12才 上海・大連 12才~20才 兵庫 20才~ 東京 CAIO / Generative AI Research Engineer 下垣内 隆太 2
  2. Elith • CEO / CTO: 井上 顧基 • 創業: 2022年12月

    • 医療・HR・建築・自動車・エネルギー系など様々な分野での AI 開発 • 研究も行う: • AAPM 米国医療物理学会 • ITSC 高度交通システム学会 • CVPR 画像映像関連AI学会 • ASJ 日本音響学会 • JSAI 人工知能学会 Elith ってどんな会社? 3 elith.co.jp
  3. LLM を使ったシステムの 4 段階 1. LLM 利用 LLM を Text

    to Text の単一の機能として利用する。 2. LLM ワークフロー LLM を決まった手順で複数回用いて目標を達成する。 「やること」を定義する。 3. シングルエージェント LLM が自己判断でツール等を利用しながら可変な手順で目標を達成する。 「できること」を定義する 4. マルチエージェント エージェントが、自律的なエージェントをツールとして利用しながら目標を達成する。 メモリや知識、利用可能なツールによってエージェント間が区別される。 5 そもそも エージェント って何?
  4. LLM を使ったシステムの 4 段階 1. LLM 利用 • 翻訳・スタイル変換 •

    Structured Output による情報の構造化 6 Colorless green ideas sleep furiously 2025年2月19日、WeWork 東京ス クエアガーデンで、AIエージェ ントLT会が開催されました。 このイベントは18:00に始まり、 150名の人が集まりました。 { “date”: 2025-02-19, “place”: “WeWork 東京スクエアガーデン”, “title”: “AIエージェントLT会”, ”start”: ”18:00”, “visitors”: 150 } 無色の緑の考えが猛烈に眠る
  5. ワークフローとエージェント 10 メリットデメリット ワークフロー エージェント 進捗率が分かる ドメイン知識やノウハウを入れやすい Dify/LangChain/LangGraph などで簡 単

    に実装できる フローを作れる程度の知見が必要 目標達成せずに終わる可能性がある いつ終わるかわからない LLM の自己判断でメチャクチャな方向 に脱線してしまう場合もある 「できること」を定義すればよく、 「やり方」に関する知見は必要ない 必要に応じて時間をかけてでも目標達成 に向けて動いてくれる
  6. エージェントは何に使うべきか 11 チェックリスト  単発の推論では解決が難しい/複数のサブタスクを伴う  様々なツール利用を伴う  タスクの中間出力に基づく、自己判断が必要 

    インタラクションする環境の変動が大きく、適応的な処理が必要  成果物の基準が明示的でなく、発散するようなアウトプットが欲しい エージェントの運用  複雑なエージェント設計・デバッグ、メンテナンスの工数や技術リソースを投入できる  自律性ゆえに予測が難しい挙動やリスクを、適切な検証・モニタリング体制で補える ワークフローでOK
  7. エージェントは何で作るべきか 12 エージェント周りのフレームワークありすぎる フレームワーク 特徴 強み 弱み LangChain/LangGraph 包括的なフレームワーク。 LangGraph

    によりループを 含む複雑なフローの制御が可 能 監視用の LangSmith, デプロイ用の Platform なども提供されており全て完結 する。また、community として様々な外 部ツール・LLM等との連携を提供 ライブラリのコードを読まないと、 カスタマイズ方法が把握できない場 合がある。 AutoGen マルチエージェントのための フレームワーク。 マルチエージェントに関して必要な機能 が提供されつつ、実装をシンプルに保つ ことができる。 デバッグ時のリプレイ機能等はな い? → AgentOps 等を利用すれば問題 ない LlamaIndex RAG ベースのエージェント を実装する際に便利。 LangChain よりもシンプル に実装できる場合も多い。 軽量化つシンプルで、RAG に関する十分 な機能が提供されている。 複雑なカスタマイズや、エージェン ト作成には向かない。 MetaGPT SOP (Standard Operating Procedure) によって連携す るマルチエージェントを構築 するフレームワーク。 ソフトウェア開発を行うマルチエージェ ントシステム構築に強い? 学習難易度が高い。コミットログが たまに中国語。 Pydantic AI 他のライブラリでもツール定 義に利用される pydantic が 開発。pydantic-graph も公 開。 型安全でデバッグしやすい。エージェン トの構築が容易で、拡張性もある。 まだ v0.0.24 で、バージョンアップ による破壊的変更が多そう。エー ジェント構築のための機能はまだ十 分ではない。