Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Google Opalで使える生成AIの能力と役割
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
MIKIO KUBO
October 12, 2025
Business
0
150
Google Opalで使える生成AIの能力と役割
MIKIO KUBO
October 12, 2025
Tweet
Share
More Decks by MIKIO KUBO
See All by MIKIO KUBO
The Fusion of Mathematical Optimization and AI (MOAI): History and Outlook (Final Version)
mickey_kubo
0
54
The Fusion of Mathematical Optimization and AI (MOAI): History and Outlook (Short Version)
mickey_kubo
1
42
The Fusion of Mathematical Optimization and AI (MOAI): History and Outlook
mickey_kubo
1
80
History and Future of MO+AI
mickey_kubo
1
72
History and Future of MO+AI (Fusion of Mathematical Optimization and Artificial Intelligence)
mickey_kubo
1
35
Next.js 入門解説: Reactとの決定的な違いとApp Routerに基づくモダンWeb開発
mickey_kubo
1
120
Google Antigravity and Vibe Coding: Agentic Development Guide
mickey_kubo
7
380
React完全入門
mickey_kubo
1
120
TypeScript初心者向け完全ガイド
mickey_kubo
1
130
Other Decks in Business
See All in Business
株式会社EventHub 会社紹介資料
eventhub
1
44k
LW_brochure_engineer
lincwellhr
0
40k
株式会社Gizumo_会社紹介資料(2026.1更新)
gizumo
0
650
経営管理について / About Corporate Planning
loglass2019
0
7.5k
「自我を出さなかった」私がアジャイルに出会って─冷笑を捨て、自分の人生を「経験主義」で動かした話
kaedeyamazaki0820
1
190
AI時代のPMに求められるマインドセット
kozotaira
1
220
Mercari-Fact-book_jp
mercari_inc
7
180k
ZEIN株式会社 会社説明資料【キャリア採用向け】
zein
0
140
202601〜【合同会社プレップ湘南】COMPANY DECK
prepp
0
190
ARI会社説明
arisaiyou
1
22k
BLUEPRINTエンジニア採用_候補者向け会社説明資料
hik
0
180
それでも、変えていくーエンタープライズでビジネスと_開発をつなぐアジャイル奮闘記などから学んだAgile Leadership
junki
1
180
Featured
See All Featured
Designing for Performance
lara
610
70k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
60
42k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
180
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
Designing Powerful Visuals for Engaging Learning
tmiket
0
240
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.4k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
330
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
Transcript
Google AI モデル群 解体新書 Opal で使えるAI の能力と役割 1
はじめに:タスクに応じたAI の使い分け Opalなどのプラットフォームでは、様々な得意分野を持つAIモデルを利用できま す。 これらのモデルを 適材適所で組み合わせることで、シンプルなお手伝いから複雑な アプリケーションまで、あらゆるアイデアを実現できます。 本日は、主要なモデルを2つのカテゴリに分けて解説します。 1. テキスト・マルチモーダル系モデル
2. メディア生成系モデル 2
1. テキスト・マルチモーダル系モデル 言葉やデータを理解し、思考するAI 中心的な役割 テキストの理解、要約、生成、分析 マルチモーダルとは? テキストだけでなく、画像、音声、動画など、複数の種類の情報を同時に 扱える能力 主な用途 文章作成、データ分析、計画立案、対話など
3
Gemini 2.5 Flash 日常タスクを高速処理する、軽快なモデル 役割: 日常的なタスクや 高速な応答が得意なバランス型。 機能: 大量のタスクを低遅延で効率的に処理することに最適化。 最適な用途:
リアルタイム性が求められるチャットボット 文章の要約や分類 画像や動画のキャプション生成 4
Gemini 2.5 Pro 複雑なタスクをこなす、高性能な頭脳 役割: 複雑で高度な思考を必要とするタスクを実行。 機能: Flash より高度な推論、コーディング、マルチモーダル理解能力。 テキスト、コード、画像、音声、動画など、多様な入力を深く理解。
最適な用途: 専門的なレポートや記事の作成 複雑なデータ分析と洞察の抽出 アプリ開発のコーディング補助 5
Plan and Execute with Gemini 2.5 計画し、実行する「AI エージェント」 役割: 複雑なタスクを
自律的に計画し、実行する。 機能: 曖昧な指示を具体的なステップに分解。 必要なツール(他のAI、Web検索など)を自動で呼び出してタスクを遂 行。 例: 「競合他社の最新動向を調査してレポートを作成して」という指示だけ で、計画から実行までを自動化。 6
Deep Research with Gemini 2.5 特定分野を深掘りする「AI リサーチャー」 役割: 特定トピックに関する 詳細な調査とレポート生成。
機能: AIが自ら調査計画を立て、Webから信頼性の高い情報を収集・分析。 最終的に 出典リンク付きで、構造化された詳細なレポートを生成。 強み: 情報の信頼性が高く、ファクトチェックの手間を削減。 7
2. メディア生成系モデル テキストから、新たな創造物を生み出すAI 中心的な役割 画像、音声、動画、音楽といったメディアをゼロから生成 仕組み プロンプト(テキストによる指示)を解釈し、対応するメディアコンテン ツを生成 主な用途 アート制作、デザイン、BGM作成、動画コンテンツ制作など
8
Imagen 4 テキストから高品質な画像を生成 役割: プロンプトから フォトリアルな画像を生成。 機能: 非常にリアルで高解像度な画像を生成。 特に、 人物の骨格や手の描写、
画像内のテキスト表現の正確性に優れる。 最適な用途: 広告ビジュアルの作成 ブログやプレゼン資料の挿絵 アート作品の制作 9
Gemini 2.5 Flash Image 画像を生成し、さらに対話で「編集」する 役割: テキストと画像を基に、 画像の生成と編集を行う。 機能: Imagen
4 の生成能力に加え、 既存画像の編集が得意。 「この人物を消して」「背景を森に変えて」といった自然言語での対話的 な指示で画像を修正。 最適な用途: 写真のレタッチや修正 既存の画像をベースにしたコラージュ作成 10
AudioLM テキストから人間のようなスピーチを生成 役割: テキストを 自然な音声に変換。 機能: 入力されたテキストを、人間らしいイントネーションや感情で読み上げ る。 短い音声の「続き」を違和感なく生成することも可能。 最適な用途:
オーディオブックのナレーション 動画の吹き替え ポッドキャスト制作 11
Veo テキストや画像から高品質な動画を生成 役割: 指示に基づいて リアルな動画を生成。 機能: 物理法則や光の表現に優れた、シネマティックな動画を生成。 最新版では、動画の内容に合った 音声も同時に生成可能。 最適な用途:
製品のプロモーションビデオ コンセプトの可視化 ショート動画コンテンツの制作 12
Lyria 2 テキストからプロ品質の音楽を生成 役割: **楽器演奏の音楽(インストゥルメンタル)**を生成。 機能: 「壮大なオーケストラ」「落ち着いたジャズピアノ」といった指示だけで 音楽を生成。 プロ品質で、商用利用も可能なレベル。 最適な用途:
動画コンテンツのBGM作成 作曲や編曲のアイデア出し アプリやゲームの背景音楽 13
まとめ 適材適所のAI を組み合わせて、アイデアを形に 思考するAI: Gemini Flash, Pro, Plan/Execute, Deep Research
創造するAI: Imagen, Flash Image, AudioLM, Veo, Lyria これらのモデルの特性を理解し、組み合わせることで、 あなたのアイデアはより強力なアプリケーションへと進化します。 14