AIエージェント開発の未来：Difyによるエージェントデザインパターン構築の試み

Difyによるエージェントデザインパターン構築の試み A I エージェント
開発の未来

自己紹介大城海斗 Oshiro kaito 2024年4月バックエンドエンジニア入社 LangChain / LangGraph
/ Difyを用いた生成AIツールの開発サイバーエージェント > AIオペレーション室

01 AIエージェント 02 エージェントデザインパターンについて 03 Difyで構築：エージェントデザインパターン例 04 まとめ　 Contents

AIエージェント作ってますか? 01

AIエージェントとは

環境に適応して、与えられた指示を遂行する AIシステム??

システムに落とす時、この言語化レベルでエージェント作れるの?

AIエージェントに書かれているものが色々

AIエージェントに必要な機能 Profile Contents 属性情報：年齢や居住地など性格情報：性格特性や好みなど社会的背景：関係性や役割など Generation Strategy 手作業でのプロフィール作成大規模言語モデルによる生成
既存データセットとのアラインメント P r o f i l e ( 役割、個性 ) Planning without Feedback Single-path Reasoning（単一路径での思考） Multi-path Reasoning（複数経路を並行・比較する思考） External Planner（外部システムを利用する計画立案） Planning with Feedback Environment Feedback（環境からの情報を取り込みながらの計画修正） Human Feedback（人間からの指示・評価を取り込む） Model Feedback（モデル自身の推論からフィードバックを得る） P l a n n i n g ( 行動の計画 ) Action Target（アクションの目的） Task Completion（タスクの完了） Exploration（探索や学習） Communication（対話・コミュニケーション） Action Production（アクションの生成） Memory Recollection（必要な記憶の呼び出し） Plan Following（計画に従う） A c t i o n ( タスク実行 ) Action Space（アクションの空間・種類） Tools（外部ツールの利用） Self-Knowledge（自分自身に関する情報の活用） Action Impact（アクションの影響） Environments（周囲の環境や状況に変化を与える） New Actions（新たな行動や次のアクションを誘発する） Internal States（エージェント内部の状態に影響を与える） Memory Structure すべての記憶を一元的に管理する構造長期・短期など複数種類のメモリを組み合わせた構造 Memory Formats 言語ベースの表現、テキストなどベクトル表現データベース形式リスト形式 Memory Operation 過去の記憶を読み取る新しい情報を書き込み、更新する過去の情報を振り返り、要約したり考察したりする M e m o r y ( 会話の記憶 )

AIエージェントに必要な機能 Profile Contents 属性情報：年齢や居住地など性格情報：性格特性や好みなど社会的背景：関係性や役割など Generation Strategy 手作業でのプロフィール作成大規模言語モデルによる生成
既存データセットとのアラインメント P r o f i l e ( 役割、個性 ) Planning without Feedback Single-path Reasoning（単一路径での思考） Multi-path Reasoning（複数経路を並行・比較する思考） External Planner（外部システムを利用する計画立案） Planning with Feedback Environment Feedback（環境からの情報を取り込みながらの計画修正） Human Feedback（人間からの指示・評価を取り込む） Model Feedback（モデル自身の推論からフィードバックを得る） P l a n n i n g ( 行動の計画 ) Action Target（アクションの目的） Task Completion（タスクの完了） Exploration（探索や学習） Communication（対話・コミュニケーション） Action Production（アクションの生成） Memory Recollection（必要な記憶の呼び出し） Plan Following（計画に従う） A c t i o n ( タスク実行 ) Action Space（アクションの空間・種類） Tools（外部ツールの利用） Self-Knowledge（自分自身に関する情報の活用） Action Impact（アクションの影響） Environments（周囲の環境や状況に変化を与える） New Actions（新たな行動や次のアクションを誘発する） Internal States（エージェント内部の状態に影響を与える） Memory Structure すべての記憶を一元的に管理する構造長期・短期など複数種類のメモリを組み合わせた構造 Memory Formats 言語ベースの表現、テキストなどベクトル表現データベース形式リスト形式 Memory Operation 過去の記憶を読み取る新しい情報を書き込み、更新する過去の情報を振り返り、要約したり考察したりする M e m o r y ( 会話の記憶 ) この要素が含まれていればエージェントっぽい振る舞いはするだろう

AIエージェントエージェントの振る舞いはできそうと言いつつも

Difyでエージェント構築できてますか? 01

エージェント構築難しいワークフローどうやって構築すべきか悩む構築にパターンがないこういう悩みを持っている方いらっしゃるのでは?

今日話したいこと Difyでエージェント構築をするためにエージェントデザインパターンを知って、 Difyのエージェント(ワークフロー)構築の幅を広げよう

エージェントデザインパターンって何? 02

エージェントデザインパターンとは複数のLLM(エージェント)が相互に連携して、目的を達成するための設計パターンエージェントを設計するときの選択肢みたいなもの

参考にしたものタイトル概要エージェントデザインカタログエージェント設計のパターンを 18個紹介、複雑化するエージェント設計のために設計ガイドラインの提供

ピックアップしたものを紹介します 1. プロンプト・レスポンス最適化 2. 役割ベース 3. リフレクション(チェック)

①入力をいい感じにする ②出力をいい感じにするプロンプト・レスポンス最適化ざっくり説明

プロンプト・レスポンス最適化アウトプットが大幅に変わることはないが、細かい言い回しや欲しい追加情報がアウトプットされる

プロンプト・レスポンス最適化 - Dify_ver

結果: 入力(カレーの作り方教えて) プロンプト最適レスポンス最適

通常のものと比較: 入力(カレーの作り方教えて)

レスポンス最適通常のものと比較: 入力(カレーの作り方教えて) 通常アウトプット

レスポンス最適プロンプト・レスポンス最適化通常アウトプット細かい文章の最適化追加情報などが追加される

役割ベースユーザの入力に対して、計画を立ててタスクを生成しタスクを実行していくというような流れを1つのLLM に任せず、それぞれ分けて実行していく

役割ベース- Dify_ver ユーザの入力情報をもとに、検索を行ってレポートを返す

比較用：役割なしDify_ver ユーザの入力情報をもとに、検索を行ってレポートを返す

違いユーザの入力情報をもとに、検索を行ってレポートを返す計画&タスク生成あり計画&タスク生成なし

違い(いちごの育て方について) 計画&タスク生成あり計画&タスク生成なし左の方が細かく言語化できている

余談：ヒューマンインザループとの相性が良さそう

余談：ヒューマンインザループとの相性が良さそうチェックしてステートを切り替える human in the loop

余談：ヒューマンインザループとの相性が良さそうヒアリングすることで、ユーザのニーズを引き出し、ブレのないアウトプットになりやすい

リフレクションリフレクションとは、人でいうところのセルフチェックやクロスチェックになります

メリットアウトプットが正しいかチェックした後に出力できる

リフレクション　図で表すと目標設定タスク分解タスク実行実行結果をリフレクション判定実行結果をまとめる次のタスクへ
タスク完了もう一度実行全タスク終了 Claude Gemini GPT 人間アウトプットのチェック

目標設定タスク分解タスク実行実行結果をリフレクション判定実行結果をまとめる次のタスクへリフレクション　Difyでできるの?
タスク完了もう一度実行全タスク終了 Claude Gemini GPT 人間チェックはありがたいが、 DIfyに同じものをループする機能はない

画像分析リフレクション _dify ver 画像からペルソナを作成する

リフレクション _dify ver 画像分析

デモ動画動いている様子

リフレクション _dify ver 画像分析

デモ動画動いている様子

まとめ Difyでエージェント構築をするためにエージェントデザインパターンを知って、 Difyのエージェント(ワークフロー)構築の幅を広げよう

ありがとうございました！ Thank you!

AIエージェント開発の未来：Difyによるエージェントデザインパターン構築の試み

AIエージェント開発の未来：Difyによるエージェントデザインパターン構築の試み

More Decks by 大城海斗

Featured

Transcript