Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIエージェントで90秒の広告動画を制作!台本・音声・映像・編集をつなぐAWS最新アーキテクチ...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Kiminori Yokoi
September 16, 2025
Technology
3
870
AIエージェントで90秒の広告動画を制作!台本・音声・映像・編集をつなぐAWS最新アーキテクチャの実践
AIAgent勉強会 #7〜動画生成Agent、AI-DLC、Code interpreter
https://almondo.connpass.com/event/367052/
Kiminori Yokoi
September 16, 2025
Tweet
Share
More Decks by Kiminori Yokoi
See All by Kiminori Yokoi
AIエージェントによる業務効率化への飽くなき挑戦-AWS上の実開発事例から学んだ効果、現実そしてギャップ-
nasuvitz
5
2k
AWSでAgentic AIを開発するための前提知識の整理
nasuvitz
2
420
Amazon Bedrock AgentCore でプロモーション用動画生成エージェントを開発する
nasuvitz
6
1k
AI Agent による実装のベストプラクティス - AI Coding Agent の効果証明と組織展開
nasuvitz
21
6.5k
AIコーディングエージェント勉強会
nasuvitz
33
19k
社員3,000名が参加する社内AWS技術者コミュニティ 「TAWS-UG」運営の舞台裏
nasuvitz
1
340
Amazon Bedrock Multi-Agent Collaboration Workshop の紹介 - ワークショップでAIエージェントを学ぼう
nasuvitz
5
1.4k
私たちはどう生きるか - 今、Jr. Champions と Ambassadors の皆様と考えたいこと -
nasuvitz
4
570
Amazon Bedrockで画像生成AIを始めよう - 素敵画像を作る文学とAI絵師Botのススメ -
nasuvitz
0
94
Other Decks in Technology
See All in Technology
Bill One急成長の舞台裏 開発組織が直面した失敗と教訓
sansantech
PRO
1
190
データの整合性を保ちたいだけなんだ
shoheimitani
7
2.7k
茨城の思い出を振り返る ~CDKのセキュリティを添えて~ / 20260201 Mitsutoshi Matsuo
shift_evolve
PRO
1
170
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
3k
Introduction to Bill One Development Engineer
sansan33
PRO
0
360
Frontier Agents (Kiro autonomous agent / AWS Security Agent / AWS DevOps Agent) の紹介
msysh
3
140
SREのプラクティスを用いた3領域同時 マネジメントへの挑戦 〜SRE・情シス・セキュリティを統合した チーム運営術〜
coconala_engineer
2
560
日本語テキストと音楽の対照学習の技術とその応用
lycorptech_jp
PRO
1
410
Meshy Proプラン課金した
henjin0
0
240
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
370
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
6
67k
日本の85%が使う公共SaaSは、どう育ったのか
taketakekaho
1
130
Featured
See All Featured
sira's awesome portfolio website redesign presentation
elsirapls
0
140
Typedesign – Prime Four
hannesfritz
42
2.9k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
54
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
140
Deep Space Network (abreviated)
tonyrice
0
44
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Tell your own story through comics
letsgokoyo
1
800
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
300
Transcript
AIエージェントで90秒の広告動画を制作! 台本・音声・映像・編集をつなぐ AWS最新アーキテクチャの実践 2025/9/16 Kiminori Yokoi @nasuvit_z
2 AIエージェントとは • LLM(大規模言語モデル)を “頭脳” として、次に何を するか(実行順序)を自ら決め、必要に応じてツールや コードを使ってタスクを完了する仕組み • 従来は人間が行うタスクを、AIエージェントによってど
こまで代替できるのかが注目されている
3 引用: https://aws.amazon.com/jp/blogs/news/introducing-strands-agents-an-open-source- ai-agents-sdk/
https://aws.amazon.com/jp/bedrock/agentcore/
5 Amazon Bedrock AgentCore とは • AIエージェントを、安全に本番運用するためのモジュール群(イン フラ+ツール+運用管理)を提供するAWSのマネージドサービス • デプロイまでを5分で体験するサンプルコードは公式ブログを参照
6 <事例> プロモーション動画生成エージェント • 「台本作成」 「音声生成」 「動画生成」 「動画編集」 の4つの ツールを持たせたAIエージェント
• AIエージェントに自然言語で指示を出すと、これらのツールを 自律的に組み合わせて、動画を生成する • 従来、これらのタスクは別々な人が行ったものを切り貼りする ような形で実施していたため、 コミュニケーションも含めて、 完成までに多大な時間を要したが、AIエージェント化したこと で、作業速度が向上し、リトライ検証も容易になったため、 完成までの時間が90%近く削減 (但し質はそれなりの物)
7 アーキテクチャ図 AWSの技術者表彰アワードを 解説する動画を作って Strands Agents • AIエージェントを開発するための オープンソースのSDK
8 生成された動画 こちら
9 ここからは、開発中に苦労したことの紹介です
10 苦労したこと • 何度も同じツールを呼び出そうとする • そのAPIの実行にはかなり大きなお金がかかるんですよ • もう動画はできているのに何故あなたはもう一回作ろうとするのですか もうやめてy (ry
• いったい何回実行すれば気が済むのですか • 振り出しに戻ろうとする • もうゴールしてください、双六じゃないんですよ
11 使う人は結果さえ良ければそれで良いのだが 引用: https://aws.amazon.com/jp/blogs/news/introducing-strands-agents-an-open-source-ai-agents-sdk/ • 推論が高額なモデルに繰り 返し指示 (破産リスク) • リクエスト上限への到達
• APIリクエスト課金の上昇 (破産リスク) • リクエスト上限への到達 • ツールは1回呼び出して終わることもあれ ば、10回以上の時もある (不確実性高) • 途中の生成物は破棄されて無駄になる サービス運営者はそうもいかない • 実行機会あたりの処理時間 の上昇による課金の高額化 • 無駄な生成物が蓄積される ことによるストレージ課金
12 特に非同期処理待ちと Agentic Loop の組み合わせは危険 • Agentic Loop の中で処理の完了待ちをするのはやめる (Loop
の外で待つようにする) 動画生成ツール 動画生成指示 (start_async_invoke) ※非同期 動画ができるまで繰り返しステータス確認 (get_async_invoke) ※非同期 待ち時間が長くなる (6秒間の動画に約90秒、2分間の動画に約14分~17分)
13 特に非同期処理待ちと Agentic Loop の組み合わせは危険 • 1つのツールの待ち時間が長くなると、もう待てないと言わんば かりに、割り込んで別のツールを使い始める現象を観測 動画生成ツール 台本生成ツール
17分待ち 何度もポーリング 音声生成ツール えっまだ動画生成終わってないんだけど、、、 別にエラー出たわけじゃないんだけど、、、 !
14 特に非同期処理待ちと Agentic Loop の組み合わせは危険 • その結果「(動画生成ツールから) tool_result が返ってくるはず なのに、(別なツールの処理が割り込んだせいで)
返ってこな かった」というエラーが発生して、Agent の処理が落ちる • ちなみに動画生成処理は投げっぱなしで落ちない。非同期だから、、、
15 Agentic Loop に組み込まない方が良いと考えられる処理 (研究中) • 待ち時間が長い同期処理 • 60秒でも他のツール実行処理に割り込まれてしまう •
繰り返し実行するポーリング処理 • 完了するまで繰り返してくれれば良いが、その保証がない • 動画生成などの完了待ちは、429エラーのリスクもある • エクスポネンシャルバックオフすると前述の割り込みリスク有 • 繰り返されたら困る処理 • 高額課金を伴うなど これらは Agent オブジェクトの外で処理する
16 まとめ • 特性を理解して使えば、AIエージェントでちゃんと業務効率化 できます • ChatGPTができないことを、オリジナルのAIエージェントで実 現しましょう! • 現在、動画のクオリティを高めるための改修が続いています
• 外部ソースの参照 (これは検索と統合する形で完成) • BGMの作成 (挑戦中) • etc… • 今後の発展にご期待ください! またどこかで披露します!