Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIエージェントで90秒の広告動画を制作!台本・音声・映像・編集をつなぐAWS最新アーキテクチ...
Search
Kiminori Yokoi
September 16, 2025
Technology
3
610
AIエージェントで90秒の広告動画を制作!台本・音声・映像・編集をつなぐAWS最新アーキテクチャの実践
AIAgent勉強会 #7〜動画生成Agent、AI-DLC、Code interpreter
https://almondo.connpass.com/event/367052/
Kiminori Yokoi
September 16, 2025
Tweet
Share
More Decks by Kiminori Yokoi
See All by Kiminori Yokoi
Amazon Bedrock AgentCore でプロモーション用動画生成エージェントを開発する
nasuvitz
6
780
AI Agent による実装のベストプラクティス - AI Coding Agent の効果証明と組織展開
nasuvitz
21
5.7k
AIコーディングエージェント勉強会
nasuvitz
33
18k
社員3,000名が参加する社内AWS技術者コミュニティ 「TAWS-UG」運営の舞台裏
nasuvitz
1
250
Amazon Bedrock Multi-Agent Collaboration Workshop の紹介 - ワークショップでAIエージェントを学ぼう
nasuvitz
5
1.3k
私たちはどう生きるか - 今、Jr. Champions と Ambassadors の皆様と考えたいこと -
nasuvitz
4
510
Amazon Bedrockで画像生成AIを始めよう - 素敵画像を作る文学とAI絵師Botのススメ -
nasuvitz
0
75
AWS re:Invent 2023 で Generative AI を学ぼう! 関連セッションを一挙紹介!
nasuvitz
1
800
Other Decks in Technology
See All in Technology
非エンジニアのあなたもできる&もうやってる!コンテキストエンジニアリング
findy_eventslides
3
880
Oracle Cloud Infrastructure:2025年9月度サービス・アップデート
oracle4engineer
PRO
0
370
KMP の Swift export
kokihirokawa
0
310
#普通の文系サラリーマンチャレンジ 自分でアプリ開発と電子工作を続けたら人生が変わった
tatsuya1970
0
920
リーダーになったら未来を語れるようになろう/Speak the Future
sanogemaru
0
250
PythonとLLMで挑む、 4コマ漫画の構造化データ化
esuji5
1
130
Modern_Data_Stack最新動向クイズ_買収_AI_激動の2025年_.pdf
sagara
0
190
Flaky Testへの現実解をGoのプロポーザルから考える | Go Conference 2025
upamune
1
390
履歴 on Rails: Bitemporal Data Modelで実現する履歴管理/history-on-rails-with-bitemporal-data-model
hypermkt
0
2k
多野優介
tanoyusuke
1
180
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
3
20k
20250929_QaaS_vol20
mura_shin
0
110
Featured
See All Featured
The Pragmatic Product Professional
lauravandoore
36
6.9k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Navigating Team Friction
lara
189
15k
Producing Creativity
orderedlist
PRO
347
40k
KATA
mclloyd
32
14k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.5k
Writing Fast Ruby
sferik
629
62k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
32
2.2k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
840
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
Transcript
AIエージェントで90秒の広告動画を制作! 台本・音声・映像・編集をつなぐ AWS最新アーキテクチャの実践 2025/9/16 Kiminori Yokoi @nasuvit_z
2 AIエージェントとは • LLM(大規模言語モデル)を “頭脳” として、次に何を するか(実行順序)を自ら決め、必要に応じてツールや コードを使ってタスクを完了する仕組み • 従来は人間が行うタスクを、AIエージェントによってど
こまで代替できるのかが注目されている
3 引用: https://aws.amazon.com/jp/blogs/news/introducing-strands-agents-an-open-source- ai-agents-sdk/
https://aws.amazon.com/jp/bedrock/agentcore/
5 Amazon Bedrock AgentCore とは • AIエージェントを、安全に本番運用するためのモジュール群(イン フラ+ツール+運用管理)を提供するAWSのマネージドサービス • デプロイまでを5分で体験するサンプルコードは公式ブログを参照
6 <事例> プロモーション動画生成エージェント • 「台本作成」 「音声生成」 「動画生成」 「動画編集」 の4つの ツールを持たせたAIエージェント
• AIエージェントに自然言語で指示を出すと、これらのツールを 自律的に組み合わせて、動画を生成する • 従来、これらのタスクは別々な人が行ったものを切り貼りする ような形で実施していたため、 コミュニケーションも含めて、 完成までに多大な時間を要したが、AIエージェント化したこと で、作業速度が向上し、リトライ検証も容易になったため、 完成までの時間が90%近く削減 (但し質はそれなりの物)
7 アーキテクチャ図 AWSの技術者表彰アワードを 解説する動画を作って Strands Agents • AIエージェントを開発するための オープンソースのSDK
8 生成された動画 こちら
9 ここからは、開発中に苦労したことの紹介です
10 苦労したこと • 何度も同じツールを呼び出そうとする • そのAPIの実行にはかなり大きなお金がかかるんですよ • もう動画はできているのに何故あなたはもう一回作ろうとするのですか もうやめてy (ry
• いったい何回実行すれば気が済むのですか • 振り出しに戻ろうとする • もうゴールしてください、双六じゃないんですよ
11 使う人は結果さえ良ければそれで良いのだが 引用: https://aws.amazon.com/jp/blogs/news/introducing-strands-agents-an-open-source-ai-agents-sdk/ • 推論が高額なモデルに繰り 返し指示 (破産リスク) • リクエスト上限への到達
• APIリクエスト課金の上昇 (破産リスク) • リクエスト上限への到達 • ツールは1回呼び出して終わることもあれ ば、10回以上の時もある (不確実性高) • 途中の生成物は破棄されて無駄になる サービス運営者はそうもいかない • 実行機会あたりの処理時間 の上昇による課金の高額化 • 無駄な生成物が蓄積される ことによるストレージ課金
12 特に非同期処理待ちと Agentic Loop の組み合わせは危険 • Agentic Loop の中で処理の完了待ちをするのはやめる (Loop
の外で待つようにする) 動画生成ツール 動画生成指示 (start_async_invoke) ※非同期 動画ができるまで繰り返しステータス確認 (get_async_invoke) ※非同期 待ち時間が長くなる (6秒間の動画に約90秒、2分間の動画に約14分~17分)
13 特に非同期処理待ちと Agentic Loop の組み合わせは危険 • 1つのツールの待ち時間が長くなると、もう待てないと言わんば かりに、割り込んで別のツールを使い始める現象を観測 動画生成ツール 台本生成ツール
17分待ち 何度もポーリング 音声生成ツール えっまだ動画生成終わってないんだけど、、、 別にエラー出たわけじゃないんだけど、、、 !
14 特に非同期処理待ちと Agentic Loop の組み合わせは危険 • その結果「(動画生成ツールから) tool_result が返ってくるはず なのに、(別なツールの処理が割り込んだせいで)
返ってこな かった」というエラーが発生して、Agent の処理が落ちる • ちなみに動画生成処理は投げっぱなしで落ちない。非同期だから、、、
15 Agentic Loop に組み込まない方が良いと考えられる処理 (研究中) • 待ち時間が長い同期処理 • 60秒でも他のツール実行処理に割り込まれてしまう •
繰り返し実行するポーリング処理 • 完了するまで繰り返してくれれば良いが、その保証がない • 動画生成などの完了待ちは、429エラーのリスクもある • エクスポネンシャルバックオフすると前述の割り込みリスク有 • 繰り返されたら困る処理 • 高額課金を伴うなど これらは Agent オブジェクトの外で処理する
16 まとめ • 特性を理解して使えば、AIエージェントでちゃんと業務効率化 できます • ChatGPTができないことを、オリジナルのAIエージェントで実 現しましょう! • 現在、動画のクオリティを高めるための改修が続いています
• 外部ソースの参照 (これは検索と統合する形で完成) • BGMの作成 (挑戦中) • etc… • 今後の発展にご期待ください! またどこかで披露します!