Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【CA.ai #3】ワークフローから見直すAIエージェント — 必要な場面と“選ばない”判断
Search
SatoAoaka
November 28, 2025
Programming
0
320
【CA.ai #3】ワークフローから見直すAIエージェント — 必要な場面と“選ばない”判断
https://cyberagent.connpass.com/event/371245/
SatoAoaka
November 28, 2025
Tweet
Share
Other Decks in Programming
See All in Programming
エージェント開発初心者の僕がエージェントを作った話と今後やりたいこと
thasu0123
0
230
ふつうのRubyist、ちいさなデバイス、大きな一年 / Ordinary Rubyists, Tiny Devices, Big Year
chobishiba
1
400
受け入れテスト駆動開発(ATDD)×AI駆動開発 AI時代のATDDの取り組み方を考える
kztakasaki
2
540
あなたはユーザーではない #PdENight
kajitack
4
340
SourceGeneratorのマーカー属性問題について
htkym
0
170
AWS Infrastructure as Code の新機能 2025 総まとめ 〜SA 4人による怒涛のデモ祭り〜
konokenj
10
3.2k
Go1.26 go fixをプロダクトに適用して困ったこと
kurakura0916
0
330
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
290
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
410
atmaCup #23でAIコーディングを活用した話
ml_bear
4
750
DevinとClaude Code、SREの現場で使い倒してみた件
karia
1
970
TROCCOで実現するkintone+BigQueryによるオペレーション改善
ssxota
0
140
Featured
See All Featured
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Designing for humans not robots
tammielis
254
26k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
460
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
80
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
430
Writing Fast Ruby
sferik
630
63k
What's in a price? How to price your products and services
michaelherold
247
13k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
Unsuck your backbone
ammeep
672
58k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
280
Transcript
ワークフローから見直す AIエージェント — 必要な場面と“選ばない”判断 —
佐藤晴輝 • 所属 サイバーエージェント > AI 事業本部 • 業務内容 クリエイティブ生成AIプラットフォーム「AI
SCREAM」の バックエンドエンジニア @akp_working
1. エージェントを使って失敗した例 2. LLM/ワークフロー/エージェント 3. ワークフローの強みと弱み 4. エージェントの強みと弱み 5. まとめ
エージェントを使って 失敗した例
※これから紹介するサンプルはかなり抽象化してます 雰囲気で読み取ってください
ケーキ作成エージェント
オーブンツール • インプット 焼く内容の指定 • 副作用 焼いた結果が倉庫に保存される • レスポンス オーブンリザルトID
素材準備ツール • インプット 欲しい材料の指定 • 副作用 用意した材料が倉庫に保存される • レスポンス 材料IDのリスト
デコレーションツール • インプット ユーザーからのデザインの要望 素材のIDのリスト • 副作用 完成したケーキが倉庫に保存される※ • レスポンス
完成したケーキのID ※バーチャルケーキなので倉庫にある材料も無くならないとします
ケーキ作成エージェント • エージェントの目的 ユーザーの要望に従ってケーキを作成するエージェント • 提供されるツール 1. オーブンツール 2. 素材準備ツール
3. デコレーションツール それぞれのツールは完璧に仕事をこなし、在庫もなくならない夢のツールとします
(再掲)ケーキ作成エージェント いちごショー トが食べた い!
夢のようなツールを持ってしても 失敗した例をご紹介します
失敗ケース1 デコレーションする元がないためケーキが完成しない
失敗ケース2 ケーキは完成するが、今回用意したみかんと生クリームは使われない
失敗ケース3 ケーキは完成するがスポンジが一つ使われない
• ケース3:余計なステップの実行 エージェントが常に最短経路を選んでくれるとは限らない • ケース1:実行漏れ/順序崩れ ツールの実行順に前提条件があっても、それを守らせるのが難しい • ケース2:中間物の取り違え 今回のケーキ作成エージェントはツールの成果物をIDでしか認識していない。 「今回作った素材を使う」という判断を必ずさせるのは難しい
失敗ケースまとめ エージェントの判断次第で想定した動きをしてくれないことがある
エージェント辛い。。。 他に方法はなかったのかな?
LLM/ ワークフロー/ エージェント
エージェントとは? 定義が人によって様々 Anthropic は広義のエージェントという概念について ワークフローや(狭義 の)エージェントのようなアーキテクチャの区分があるとしています LLM/ワークフロー/エージェントという単語について 以下のページをもとに整理します https://www.anthropic.com/engineering/building-effective-agents
(拡張)LLM シンプルなモデルの呼び出しに加えて、検索やツールの実行などの拡張機能ま でを含めたもの 以降のワークフロー、エージェントが内部で利用するLLMはこれらの拡張機能が使える前提になります 引用:The augmented LLM
ワークフロー LLMとツールを「事前定義されたコードパス」で オーケストレーションするシステムのこと 実行フローは固定され、各ステップにゲートや検証を挿入できる 構成パターン例: プロンプトの連鎖/ルーティング/並列化 など
エージェント LLMが自らプロセスとツールの使用を「動的に指揮」するシステム • 計画→行動→観測を反復し、環境からの事実で進捗を評価 • チェックポイントや停止条件、HITL(人手インザループ)を組み込める • エージェントがワークフローを呼び出すことも可能 逆にワークフローが特定のステップでエージェントを呼ぶことも可能
ワークフローの強みと弱み
(再掲)ワークフロー LLMとツールを「事前定義されたコードパス」でオーケストレーションするシ ステムのこと 実行フローは固定され、各ステップにゲートや検証を挿入できる 構成パターン例: プロンプトの連鎖/ルーティング/並列化 など
ワークフローの強み • 決定的に実行できる • 条件分岐やエラーハンドリングも融通が効く • LLMの問題ではなくプログラムの問題にできる 引用:プロンプト連鎖ワークフロー 引用:ルーティングワークフロー
ワークフローを使った分岐 ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM
ワークフローの弱み • 未知のパターンへの弱さ • コンテキストの管理が難しい • 機能が増えてくると保守が困難
未知のパターンへの弱さ ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM チーズケーキを作っ て 作れないと回答するべき?近いやつで出すべき?
コンテキストの管理が難しい ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM このLLMの思考はコンテキストに残す? 残す場合はどこまで残す?
コンテキストの管理が難しい ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM このLLMの思考はコンテキストに残す? 残す場合はどこまで残す? ショートケーキ専門LLMのコンテキスト をチョコケーキ専門LLMに渡す?
機能が増えてくると保守が困難 ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM ・ ・ ・
エージェントの強みと弱み
(再掲)エージェント LLMが自らプロセスとツールの使用を「動的に指揮」するシステム • 計画→行動→観測を反復し、環境からの事実に基づいて進捗を評価 • チェックポイントや停止条件、HITL(人手インザループ)を組み込める • エージェントがワークフローを呼び出すことも可能 逆にワークフローが特定のステップでエージェントを呼ぶことも可能
エージェントの強み • 目的に対し計画→行動→観測を自律ループで遂行(途中で再計画が可能) 道のりが決まってない問題や未知のパターンへの適応力を持つ 引用:自律エージェント
自律ループ 終了条件を満たしていなければ追加の作業を実行できる イチゴが 足りな い!
自律ループ エラー内容を確認し、計画を修正できる エラー発 生! 再計画 キャンセ ル
未知パターンへの適応力 みかんケーキ を作って! りんごパイを 作って!
エージェントの弱み • ばらつき/非決定性が高く、SLAや再現性の確保が難しい 挙動が安定しない • 制御できる方法はあるが、実装難易度が高い チェックポイント/停止条件/ツール設計 など整備のコストが高い • LLMの思考が挟まるので時間と推論コストがかかる
• ケース3:余計なステップの実行 エージェントが常に最短経路を選んでくれるとは限らない • ケース1:実行漏れ/順序崩れ ツールの実行順に前提条件があっても、それを守らせるのが難しい • ケース2:中間物の取り違え 今回のケーキ作成エージェントはツールの成果物をIDでしか認識していない。 「今回作った素材を使う」という判断を必ずさせるのは難しい
(再掲)失敗ケースまとめ エージェントの判断次第で想定した動きをしてくれないことがある
まとめ
まとめ 1. 一種類のケーキのみ作れればOK -> LLM 2. いちごショートもみかんケーキも作りたい(焼く->素材作る->デコる) 単発LLMでは済まないが固定の手順 -> ワークフロー
3. りんごパイ(想定外のケーキ)も作りたい(焼く,素材作る,デコるが順不同) -> エージェント
結論 エージェントを使うのはどうしても必要な時だけにしよう
ありがとうございました