Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Google Opalで使える生成AIの能力と役割
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
MIKIO KUBO
October 12, 2025
Business
200
0
Share
Google Opalで使える生成AIの能力と役割
MIKIO KUBO
October 12, 2025
More Decks by MIKIO KUBO
See All by MIKIO KUBO
AlgorithAlgorihms for Decision Making
mickey_kubo
0
54
エージェントスキル:自律型AIが変える最適化とサプライチェーンの未来
mickey_kubo
0
70
エージェントスキルによる最適化
mickey_kubo
2
120
Agent Skills 完全ガイド
mickey_kubo
0
75
Skill Creatorの技術設計と動作原理
mickey_kubo
0
82
AI+SCM
mickey_kubo
0
62
エージェンティック・サプライチェーン」の概念と、製造業におけるその革新的な役割について解説
mickey_kubo
0
71
MOAI Solutionの紹介 -電力最適化を中心として-
mickey_kubo
0
84
Agent SkillsによるAGI4OPT(最適化のためのAGI)
mickey_kubo
0
120
Other Decks in Business
See All in Business
AnyMind Group Credential Deck(EN)
anymind
3
81k
Copilot×ローカルLLM ― 出せないデータをどう活かすか
aonomasahiro
1
200
株式会社PROOF_カルチャーデック
proof
2
1.8k
ゼロスペック株式会社_会社紹介資料/zerospec-company-introduction
zerospec2
0
380
『今日から使える認知行動療法』でみつけた もっと人生をたのしむヒント
mkitahara01985
1
610
Practical Guide to Landing Your First Job on Upwork
x5gtrn
PRO
0
140
BASE株式会社 統合報告書2026
base
PRO
0
1.1k
Brush Company Deck ver1.0
brush2026
0
470
ITが何の略なのかも知らないままエンジニアになっちゃったのでインターネットに生き恥を晒してみた話
m_k__77
0
180
merpay-Overview
mercari_inc
8
200k
Codexを安心して業務活用するには?──「権限・接続・実行」の考え方
hima2b4
0
230
SHIFT ASIA 会社説明資料 V2.4
shiftasiarec
0
3.4k
Featured
See All Featured
Navigating Weather and Climate Data
rabernat
0
200
Git: the NoSQL Database
bkeepers
PRO
432
67k
Darren the Foodie - Storyboard
khoart
PRO
3
3.3k
How to Talk to Developers About Accessibility
jct
2
210
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
220
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
A better future with KSS
kneath
240
18k
Color Theory Basics | Prateek | Gurzu
gurzu
0
320
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
390
Transcript
Google AI モデル群 解体新書 Opal で使えるAI の能力と役割 1
はじめに:タスクに応じたAI の使い分け Opalなどのプラットフォームでは、様々な得意分野を持つAIモデルを利用できま す。 これらのモデルを 適材適所で組み合わせることで、シンプルなお手伝いから複雑な アプリケーションまで、あらゆるアイデアを実現できます。 本日は、主要なモデルを2つのカテゴリに分けて解説します。 1. テキスト・マルチモーダル系モデル
2. メディア生成系モデル 2
1. テキスト・マルチモーダル系モデル 言葉やデータを理解し、思考するAI 中心的な役割 テキストの理解、要約、生成、分析 マルチモーダルとは? テキストだけでなく、画像、音声、動画など、複数の種類の情報を同時に 扱える能力 主な用途 文章作成、データ分析、計画立案、対話など
3
Gemini 2.5 Flash 日常タスクを高速処理する、軽快なモデル 役割: 日常的なタスクや 高速な応答が得意なバランス型。 機能: 大量のタスクを低遅延で効率的に処理することに最適化。 最適な用途:
リアルタイム性が求められるチャットボット 文章の要約や分類 画像や動画のキャプション生成 4
Gemini 2.5 Pro 複雑なタスクをこなす、高性能な頭脳 役割: 複雑で高度な思考を必要とするタスクを実行。 機能: Flash より高度な推論、コーディング、マルチモーダル理解能力。 テキスト、コード、画像、音声、動画など、多様な入力を深く理解。
最適な用途: 専門的なレポートや記事の作成 複雑なデータ分析と洞察の抽出 アプリ開発のコーディング補助 5
Plan and Execute with Gemini 2.5 計画し、実行する「AI エージェント」 役割: 複雑なタスクを
自律的に計画し、実行する。 機能: 曖昧な指示を具体的なステップに分解。 必要なツール(他のAI、Web検索など)を自動で呼び出してタスクを遂 行。 例: 「競合他社の最新動向を調査してレポートを作成して」という指示だけ で、計画から実行までを自動化。 6
Deep Research with Gemini 2.5 特定分野を深掘りする「AI リサーチャー」 役割: 特定トピックに関する 詳細な調査とレポート生成。
機能: AIが自ら調査計画を立て、Webから信頼性の高い情報を収集・分析。 最終的に 出典リンク付きで、構造化された詳細なレポートを生成。 強み: 情報の信頼性が高く、ファクトチェックの手間を削減。 7
2. メディア生成系モデル テキストから、新たな創造物を生み出すAI 中心的な役割 画像、音声、動画、音楽といったメディアをゼロから生成 仕組み プロンプト(テキストによる指示)を解釈し、対応するメディアコンテン ツを生成 主な用途 アート制作、デザイン、BGM作成、動画コンテンツ制作など
8
Imagen 4 テキストから高品質な画像を生成 役割: プロンプトから フォトリアルな画像を生成。 機能: 非常にリアルで高解像度な画像を生成。 特に、 人物の骨格や手の描写、
画像内のテキスト表現の正確性に優れる。 最適な用途: 広告ビジュアルの作成 ブログやプレゼン資料の挿絵 アート作品の制作 9
Gemini 2.5 Flash Image 画像を生成し、さらに対話で「編集」する 役割: テキストと画像を基に、 画像の生成と編集を行う。 機能: Imagen
4 の生成能力に加え、 既存画像の編集が得意。 「この人物を消して」「背景を森に変えて」といった自然言語での対話的 な指示で画像を修正。 最適な用途: 写真のレタッチや修正 既存の画像をベースにしたコラージュ作成 10
AudioLM テキストから人間のようなスピーチを生成 役割: テキストを 自然な音声に変換。 機能: 入力されたテキストを、人間らしいイントネーションや感情で読み上げ る。 短い音声の「続き」を違和感なく生成することも可能。 最適な用途:
オーディオブックのナレーション 動画の吹き替え ポッドキャスト制作 11
Veo テキストや画像から高品質な動画を生成 役割: 指示に基づいて リアルな動画を生成。 機能: 物理法則や光の表現に優れた、シネマティックな動画を生成。 最新版では、動画の内容に合った 音声も同時に生成可能。 最適な用途:
製品のプロモーションビデオ コンセプトの可視化 ショート動画コンテンツの制作 12
Lyria 2 テキストからプロ品質の音楽を生成 役割: **楽器演奏の音楽(インストゥルメンタル)**を生成。 機能: 「壮大なオーケストラ」「落ち着いたジャズピアノ」といった指示だけで 音楽を生成。 プロ品質で、商用利用も可能なレベル。 最適な用途:
動画コンテンツのBGM作成 作曲や編曲のアイデア出し アプリやゲームの背景音楽 13
まとめ 適材適所のAI を組み合わせて、アイデアを形に 思考するAI: Gemini Flash, Pro, Plan/Execute, Deep Research
創造するAI: Imagen, Flash Image, AudioLM, Veo, Lyria これらのモデルの特性を理解し、組み合わせることで、 あなたのアイデアはより強力なアプリケーションへと進化します。 14