Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIエージェント開発の未来:Difyによるエージェントデザインパターン構築の試み

大城海斗
February 27, 2025
380

 AIエージェント開発の未来:Difyによるエージェントデザインパターン構築の試み

大城海斗

February 27, 2025
Tweet

Transcript

  1. 自己紹介 大城 海斗 Oshiro kaito 2024年4月 バックエンドエンジニア入社 LangChain / LangGraph

    / Difyを用いた生成AIツールの開発 サイバーエージェント > AIオペレーション室
  2. AIエージェントに必要な機能 Profile Contents 属性情報:年齢や居住地など 性格情報:性格特性や好みなど 社会的背景:関係性や役割など Generation Strategy 手作業でのプロフィール作成 大規模言語モデルによる生成

    既存データセットとのアラインメント P r o f i l e ( 役 割 、 個 性 ) Planning without Feedback Single-path Reasoning(単一路径での思考) Multi-path Reasoning(複数経路を並行・比較する思考) External Planner(外部システムを利用する計画立案) Planning with Feedback Environment Feedback(環境からの情報を取り込みながらの計画修正) Human Feedback(人間からの指示・評価を取り込む) Model Feedback(モデル自身の推論からフィードバックを得る) P l a n n i n g ( 行 動 の 計 画 ) Action Target(アクションの目的) Task Completion(タスクの完了) Exploration(探索や学習) Communication(対話・コミュニケーシ ョン) Action Production(アクションの生成) Memory Recollection(必要な記憶の呼び 出し) Plan Following(計画に従う) A c t i o n ( タ ス ク 実 行 ) Action Space(アクションの空間・種類) Tools(外部ツールの利用) Self-Knowledge(自分自身に関する情報の活 用) Action Impact(アクションの影響) Environments(周囲の環境や状況に変化を与 える) New Actions(新たな行動や次のアクションを 誘発する) Internal States(エージェント内部の状態に 影響を与える) Memory Structure すべての記憶を一元的に管理する構造 長期・短期など複数種類のメモリを組み合わせた構造 Memory Formats 言語ベースの表現、テキストなど ベクトル表現 データベース形式 リスト形式 Memory Operation 過去の記憶を読み取る 新しい情報を書き込み、更新する 過去の情報を振り返り、要約したり考察したりする M e m o r y ( 会 話 の 記 憶 )
  3. AIエージェントに必要な機能 Profile Contents 属性情報:年齢や居住地など 性格情報:性格特性や好みなど 社会的背景:関係性や役割など Generation Strategy 手作業でのプロフィール作成 大規模言語モデルによる生成

    既存データセットとのアラインメント P r o f i l e ( 役 割 、 個 性 ) Planning without Feedback Single-path Reasoning(単一路径での思考) Multi-path Reasoning(複数経路を並行・比較する思考) External Planner(外部システムを利用する計画立案) Planning with Feedback Environment Feedback(環境からの情報を取り込みながらの計画修正) Human Feedback(人間からの指示・評価を取り込む) Model Feedback(モデル自身の推論からフィードバックを得る) P l a n n i n g ( 行 動 の 計 画 ) Action Target(アクションの目的) Task Completion(タスクの完了) Exploration(探索や学習) Communication(対話・コミュニケーシ ョン) Action Production(アクションの生成) Memory Recollection(必要な記憶の呼び 出し) Plan Following(計画に従う) A c t i o n ( タ ス ク 実 行 ) Action Space(アクションの空間・種類) Tools(外部ツールの利用) Self-Knowledge(自分自身に関する情報の活 用) Action Impact(アクションの影響) Environments(周囲の環境や状況に変化を与 える) New Actions(新たな行動や次のアクションを 誘発する) Internal States(エージェント内部の状態に 影響を与える) Memory Structure すべての記憶を一元的に管理する構造 長期・短期など複数種類のメモリを組み合わせた構造 Memory Formats 言語ベースの表現、テキストなど ベクトル表現 データベース形式 リスト形式 Memory Operation 過去の記憶を読み取る 新しい情報を書き込み、更新する 過去の情報を振り返り、要約したり考察したりする M e m o r y ( 会 話 の 記 憶 ) この要素が含まれていればエージェントっぽい 振る舞いはするだろう
  4. 目標設定 タスク分解 タスク実行 実行結果を リフレクション 判定 実行結果を まとめる 次のタスクへ リフレクション Difyでできるの?

    タスク完了 もう一度実行 全タスク終了 Claude Gemini GPT 人間 チェックはありがたいが、 DIfyに同じものをループする機能はない