【CA.ai #3】ワークフローから見直すAIエージェント — 必要な場面と“選ばない”判断

ワークフローから見直す AIエージェント — 必要な場面と“選ばない”判断 —

佐藤晴輝 • 所属サイバーエージェント > AI 事業本部 • 業務内容クリエイティブ生成AIプラットフォーム「AI
SCREAM」のバックエンドエンジニア @akp_working

1. エージェントを使って失敗した例 2. LLM/ワークフロー/エージェント 3. ワークフローの強みと弱み 4. エージェントの強みと弱み 5. まとめ

エージェントを使って失敗した例

※これから紹介するサンプルはかなり抽象化してます雰囲気で読み取ってください

ケーキ作成エージェント

オーブンツール • インプット焼く内容の指定 • 副作用焼いた結果が倉庫に保存される • レスポンスオーブンリザルトID

素材準備ツール • インプット欲しい材料の指定 • 副作用用意した材料が倉庫に保存される • レスポンス材料IDのリスト

デコレーションツール • インプットユーザーからのデザインの要望素材のIDのリスト • 副作用完成したケーキが倉庫に保存される※ • レスポンス
完成したケーキのID ※バーチャルケーキなので倉庫にある材料も無くならないとします

ケーキ作成エージェント • エージェントの目的ユーザーの要望に従ってケーキを作成するエージェント • 提供されるツール 1. オーブンツール 2. 素材準備ツール
3. デコレーションツールそれぞれのツールは完璧に仕事をこなし、在庫もなくならない夢のツールとします

(再掲)ケーキ作成エージェントいちごショートが食べたい！

夢のようなツールを持ってしても失敗した例をご紹介します

失敗ケース1 デコレーションする元がないためケーキが完成しない

失敗ケース2 ケーキは完成するが、今回用意したみかんと生クリームは使われない

失敗ケース3 ケーキは完成するがスポンジが一つ使われない

• ケース３：余計なステップの実行エージェントが常に最短経路を選んでくれるとは限らない • ケース１：実行漏れ/順序崩れツールの実行順に前提条件があっても、それを守らせるのが難しい • ケース２：中間物の取り違え今回のケーキ作成エージェントはツールの成果物をIDでしか認識していない。「今回作った素材を使う」という判断を必ずさせるのは難しい
失敗ケースまとめエージェントの判断次第で想定した動きをしてくれないことがある

エージェント辛い。。。他に方法はなかったのかな？

LLM/ ワークフロー/ エージェント

エージェントとは？定義が人によって様々 Anthropic は広義のエージェントという概念についてワークフローや（狭義の）エージェントのようなアーキテクチャの区分があるとしています LLM/ワークフロー/エージェントという単語について以下のページをもとに整理します https://www.anthropic.com/engineering/building-effective-agents

(拡張)LLM シンプルなモデルの呼び出しに加えて、検索やツールの実行などの拡張機能までを含めたもの以降のワークフロー、エージェントが内部で利用するLLMはこれらの拡張機能が使える前提になります引用：The augmented LLM

ワークフロー LLMとツールを「事前定義されたコードパス」でオーケストレーションするシステムのこと実行フローは固定され、各ステップにゲートや検証を挿入できる構成パターン例: プロンプトの連鎖／ルーティング／並列化など

エージェント LLMが自らプロセスとツールの使用を「動的に指揮」するシステム • 計画→行動→観測を反復し、環境からの事実で進捗を評価 • チェックポイントや停止条件、HITL（人手インザループ）を組み込める • エージェントがワークフローを呼び出すことも可能逆にワークフローが特定のステップでエージェントを呼ぶことも可能

ワークフローの強みと弱み

(再掲)ワークフロー LLMとツールを「事前定義されたコードパス」でオーケストレーションするシステムのこと実行フローは固定され、各ステップにゲートや検証を挿入できる構成パターン例: プロンプトの連鎖／ルーティング／並列化など

ワークフローの強み • 決定的に実行できる • 条件分岐やエラーハンドリングも融通が効く • LLMの問題ではなくプログラムの問題にできる引用：プロンプト連鎖ワークフロー引用：ルーティングワークフロー

ワークフローを使った分岐ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM

ワークフローの弱み • 未知のパターンへの弱さ • コンテキストの管理が難しい • 機能が増えてくると保守が困難

未知のパターンへの弱さショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM チーズケーキを作って作れないと回答するべき？近いやつで出すべき？

コンテキストの管理が難しいショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM このLLMの思考はコンテキストに残す？残す場合はどこまで残す？

コンテキストの管理が難しいショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM このLLMの思考はコンテキストに残す？残す場合はどこまで残す？ショートケーキ専門LLMのコンテキストをチョコケーキ専門LLMに渡す？

機能が増えてくると保守が困難ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM ・・・

エージェントの強みと弱み

(再掲)エージェント LLMが自らプロセスとツールの使用を「動的に指揮」するシステム • 計画→行動→観測を反復し、環境からの事実に基づいて進捗を評価 • チェックポイントや停止条件、HITL（人手インザループ）を組み込める • エージェントがワークフローを呼び出すことも可能逆にワークフローが特定のステップでエージェントを呼ぶことも可能

エージェントの強み • 目的に対し計画→行動→観測を自律ループで遂行（途中で再計画が可能）道のりが決まってない問題や未知のパターンへの適応力を持つ引用：自律エージェント

自律ループ終了条件を満たしていなければ追加の作業を実行できるイチゴが足りない！

自律ループエラー内容を確認し、計画を修正できるエラー発生！再計画キャンセル

未知パターンへの適応力みかんケーキを作って！りんごパイを作って！

エージェントの弱み • ばらつき/非決定性が高く、SLAや再現性の確保が難しい挙動が安定しない • 制御できる方法はあるが、実装難易度が高いチェックポイント/停止条件/ツール設計など整備のコストが高い • LLMの思考が挟まるので時間と推論コストがかかる

• ケース３：余計なステップの実行エージェントが常に最短経路を選んでくれるとは限らない • ケース１：実行漏れ/順序崩れツールの実行順に前提条件があっても、それを守らせるのが難しい • ケース２：中間物の取り違え今回のケーキ作成エージェントはツールの成果物をIDでしか認識していない。「今回作った素材を使う」という判断を必ずさせるのは難しい
(再掲）失敗ケースまとめエージェントの判断次第で想定した動きをしてくれないことがある

まとめ

まとめ 1. 一種類のケーキのみ作れればOK -> LLM 2. いちごショートもみかんケーキも作りたい（焼く->素材作る->デコる）単発LLMでは済まないが固定の手順 -> ワークフロー
3. りんごパイ(想定外のケーキ)も作りたい(焼く,素材作る,デコるが順不同） -> エージェント

結論エージェントを使うのはどうしても必要な時だけにしよう

ありがとうございました

【CA.ai #3】ワークフローから見直すAIエージェント — 必要な場面と“選ばない”判断

【CA.ai #3】ワークフローから見直すAIエージェント — 必要な場面と“選ばない”判断

Other Decks in Programming

Featured

Transcript