Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【CA.ai #3】ワークフローから見直すAIエージェント — 必要な場面と“選ばない”判断
Search
SatoAoaka
November 28, 2025
Programming
0
300
【CA.ai #3】ワークフローから見直すAIエージェント — 必要な場面と“選ばない”判断
https://cyberagent.connpass.com/event/371245/
SatoAoaka
November 28, 2025
Tweet
Share
Other Decks in Programming
See All in Programming
クラウドに依存しないS3を使った開発術
simesaba80
0
220
LLMで複雑な検索条件アセットから脱却する!! 生成的検索インタフェースの設計論
po3rin
4
1.1k
Go コードベースの構成と AI コンテキスト定義
andpad
0
160
AIエージェント、”どう作るか”で差は出るか? / AI Agents: Does the "How" Make a Difference?
rkaga
2
760
ゆくKotlin くるRust
exoego
1
200
Canon EOS R50 V と R5 Mark II 購入でみえてきた最近のデジイチ VR180 事情、そして VR180 静止画に活路を見出すまで
karad
0
140
2年のAppleウォレットパス開発の振り返り
muno92
PRO
0
180
AIの誤りが許されない業務システムにおいて“信頼されるAI” を目指す / building-trusted-ai-systems
yuya4
7
4.3k
愛される翻訳の秘訣
kishikawakatsumi
3
370
[AI Engineering Summit Tokyo 2025] LLMは計画業務のゲームチェンジャーか? 最適化業務における活⽤の可能性と限界
terryu16
2
280
AI 駆動開発ライフサイクル(AI-DLC):ソフトウェアエンジニアリングの再構築 / AI-DLC Introduction
kanamasa
11
5.2k
AIによるイベントストーミング図からのコード生成 / AI-powered code generation from Event Storming diagrams
nrslib
2
1.2k
Featured
See All Featured
Skip the Path - Find Your Career Trail
mkilby
0
42
How to train your dragon (web standard)
notwaldorf
97
6.5k
4 Signs Your Business is Dying
shpigford
187
22k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
0
220
Getting science done with accelerated Python computing platforms
jacobtomlinson
1
94
Documentation Writing (for coders)
carmenintech
77
5.2k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
37
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
280
For a Future-Friendly Web
brad_frost
180
10k
Tell your own story through comics
letsgokoyo
1
780
Crafting Experiences
bethany
0
28
Transcript
ワークフローから見直す AIエージェント — 必要な場面と“選ばない”判断 —
佐藤晴輝 • 所属 サイバーエージェント > AI 事業本部 • 業務内容 クリエイティブ生成AIプラットフォーム「AI
SCREAM」の バックエンドエンジニア @akp_working
1. エージェントを使って失敗した例 2. LLM/ワークフロー/エージェント 3. ワークフローの強みと弱み 4. エージェントの強みと弱み 5. まとめ
エージェントを使って 失敗した例
※これから紹介するサンプルはかなり抽象化してます 雰囲気で読み取ってください
ケーキ作成エージェント
オーブンツール • インプット 焼く内容の指定 • 副作用 焼いた結果が倉庫に保存される • レスポンス オーブンリザルトID
素材準備ツール • インプット 欲しい材料の指定 • 副作用 用意した材料が倉庫に保存される • レスポンス 材料IDのリスト
デコレーションツール • インプット ユーザーからのデザインの要望 素材のIDのリスト • 副作用 完成したケーキが倉庫に保存される※ • レスポンス
完成したケーキのID ※バーチャルケーキなので倉庫にある材料も無くならないとします
ケーキ作成エージェント • エージェントの目的 ユーザーの要望に従ってケーキを作成するエージェント • 提供されるツール 1. オーブンツール 2. 素材準備ツール
3. デコレーションツール それぞれのツールは完璧に仕事をこなし、在庫もなくならない夢のツールとします
(再掲)ケーキ作成エージェント いちごショー トが食べた い!
夢のようなツールを持ってしても 失敗した例をご紹介します
失敗ケース1 デコレーションする元がないためケーキが完成しない
失敗ケース2 ケーキは完成するが、今回用意したみかんと生クリームは使われない
失敗ケース3 ケーキは完成するがスポンジが一つ使われない
• ケース3:余計なステップの実行 エージェントが常に最短経路を選んでくれるとは限らない • ケース1:実行漏れ/順序崩れ ツールの実行順に前提条件があっても、それを守らせるのが難しい • ケース2:中間物の取り違え 今回のケーキ作成エージェントはツールの成果物をIDでしか認識していない。 「今回作った素材を使う」という判断を必ずさせるのは難しい
失敗ケースまとめ エージェントの判断次第で想定した動きをしてくれないことがある
エージェント辛い。。。 他に方法はなかったのかな?
LLM/ ワークフロー/ エージェント
エージェントとは? 定義が人によって様々 Anthropic は広義のエージェントという概念について ワークフローや(狭義 の)エージェントのようなアーキテクチャの区分があるとしています LLM/ワークフロー/エージェントという単語について 以下のページをもとに整理します https://www.anthropic.com/engineering/building-effective-agents
(拡張)LLM シンプルなモデルの呼び出しに加えて、検索やツールの実行などの拡張機能ま でを含めたもの 以降のワークフロー、エージェントが内部で利用するLLMはこれらの拡張機能が使える前提になります 引用:The augmented LLM
ワークフロー LLMとツールを「事前定義されたコードパス」で オーケストレーションするシステムのこと 実行フローは固定され、各ステップにゲートや検証を挿入できる 構成パターン例: プロンプトの連鎖/ルーティング/並列化 など
エージェント LLMが自らプロセスとツールの使用を「動的に指揮」するシステム • 計画→行動→観測を反復し、環境からの事実で進捗を評価 • チェックポイントや停止条件、HITL(人手インザループ)を組み込める • エージェントがワークフローを呼び出すことも可能 逆にワークフローが特定のステップでエージェントを呼ぶことも可能
ワークフローの強みと弱み
(再掲)ワークフロー LLMとツールを「事前定義されたコードパス」でオーケストレーションするシ ステムのこと 実行フローは固定され、各ステップにゲートや検証を挿入できる 構成パターン例: プロンプトの連鎖/ルーティング/並列化 など
ワークフローの強み • 決定的に実行できる • 条件分岐やエラーハンドリングも融通が効く • LLMの問題ではなくプログラムの問題にできる 引用:プロンプト連鎖ワークフロー 引用:ルーティングワークフロー
ワークフローを使った分岐 ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM
ワークフローの弱み • 未知のパターンへの弱さ • コンテキストの管理が難しい • 機能が増えてくると保守が困難
未知のパターンへの弱さ ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM チーズケーキを作っ て 作れないと回答するべき?近いやつで出すべき?
コンテキストの管理が難しい ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM このLLMの思考はコンテキストに残す? 残す場合はどこまで残す?
コンテキストの管理が難しい ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM このLLMの思考はコンテキストに残す? 残す場合はどこまで残す? ショートケーキ専門LLMのコンテキスト をチョコケーキ専門LLMに渡す?
機能が増えてくると保守が困難 ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM ・ ・ ・
エージェントの強みと弱み
(再掲)エージェント LLMが自らプロセスとツールの使用を「動的に指揮」するシステム • 計画→行動→観測を反復し、環境からの事実に基づいて進捗を評価 • チェックポイントや停止条件、HITL(人手インザループ)を組み込める • エージェントがワークフローを呼び出すことも可能 逆にワークフローが特定のステップでエージェントを呼ぶことも可能
エージェントの強み • 目的に対し計画→行動→観測を自律ループで遂行(途中で再計画が可能) 道のりが決まってない問題や未知のパターンへの適応力を持つ 引用:自律エージェント
自律ループ 終了条件を満たしていなければ追加の作業を実行できる イチゴが 足りな い!
自律ループ エラー内容を確認し、計画を修正できる エラー発 生! 再計画 キャンセ ル
未知パターンへの適応力 みかんケーキ を作って! りんごパイを 作って!
エージェントの弱み • ばらつき/非決定性が高く、SLAや再現性の確保が難しい 挙動が安定しない • 制御できる方法はあるが、実装難易度が高い チェックポイント/停止条件/ツール設計 など整備のコストが高い • LLMの思考が挟まるので時間と推論コストがかかる
• ケース3:余計なステップの実行 エージェントが常に最短経路を選んでくれるとは限らない • ケース1:実行漏れ/順序崩れ ツールの実行順に前提条件があっても、それを守らせるのが難しい • ケース2:中間物の取り違え 今回のケーキ作成エージェントはツールの成果物をIDでしか認識していない。 「今回作った素材を使う」という判断を必ずさせるのは難しい
(再掲)失敗ケースまとめ エージェントの判断次第で想定した動きをしてくれないことがある
まとめ
まとめ 1. 一種類のケーキのみ作れればOK -> LLM 2. いちごショートもみかんケーキも作りたい(焼く->素材作る->デコる) 単発LLMでは済まないが固定の手順 -> ワークフロー
3. りんごパイ(想定外のケーキ)も作りたい(焼く,素材作る,デコるが順不同) -> エージェント
結論 エージェントを使うのはどうしても必要な時だけにしよう
ありがとうございました