生成AIによる動画制作は、プロンプトごとの結果が予測できない「ガチャ」になりがちです。
本スライドでは、Google Cloudの最新モデル(Gemini 2.5 Flash / Gemini 3 Pro / Veo)を組み合わせ、制作者の「意図」を正確に映像化するための制御可能なパイプラインアーキテクチャを解説します。
単一のモデルに頼るのではなく、「アイデア構造化」「絵コンテ生成」「動画化」の3工程にAIを適材適所で配置(オーケストレーション)する「分業型ワークフロー」の全貌です。
【主な技術トピック】
- Veo (Gemini Video) による動画生成
- Gemini 2.5 Flash & JSON Schemaによる構造化
- Reference Assetを用いたキャラクターの一貫性維持(Character Consistency)
- Hidden DOM HackによるWebアプリからのPDF生成
💡 実装の詳細やコード解説を含む記事はこちら(Zenn):
https://zenn.dev/nekoai_lab/articles/d1f2c3ea51ad02
#Gemini #Veo #GenerativeAI #GoogleCloud #VertexAI