Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Google Opalで使える生成AIの能力と役割
Search
MIKIO KUBO
October 12, 2025
Business
0
74
Google Opalで使える生成AIの能力と役割
MIKIO KUBO
October 12, 2025
Tweet
Share
More Decks by MIKIO KUBO
See All by MIKIO KUBO
ポストSaaS時代:コンポーザブル、エージェント 型、成果指向ソフトウェアへの移行を読み解く
mickey_kubo
1
34
AIの二元論 -ビジネスリーダーのための水平型AIと垂直型AIに関する戦略的ガイド-
mickey_kubo
1
39
AIの二元論(詳細版)
mickey_kubo
0
7
TransformerからMCPまで(現代AIを理解するための羅針盤)
mickey_kubo
7
5.8k
Agentic AI フレームワーク戦略白書 (2025年度版)
mickey_kubo
1
69
Agentic AIを用いたサプライチェーン最適化
mickey_kubo
1
120
Google Opal解体新書
mickey_kubo
3
99
Google Opalで使える37のライブラリ
mickey_kubo
3
170
Opal 例題解説
mickey_kubo
1
83
Other Decks in Business
See All in Business
セーフィー株式会社(Safie Inc.) 会社紹介資料
safie_recruit
6
380k
株式会社ギークリー_採用ピッチ資料(2025年10月更新)
opportunity_loves_geek
3
3.6k
2025年 コミュニティ×ビジネスのリアル_Mitz
comucal
PRO
0
160
サスメド株式会社 Culture Deck
susmed
0
47k
採用ピッチ資料
awesome22
0
420
Mercari Group Code of Conduct
mercari_inc
0
270
AI駆動開発の成功と失敗 クラスメソッドの実践事例集
satoshi7
2
220
Sales Marker Culture book
salesmarker
PRO
44
76k
あつまれ_POの森_プロダクトオーナー初心者のためのやさしいQ_Aセッション.pdf
nolick1219
4
1.5k
社内請負スクラムから脱却する〜複雑性に適応するスクラムチームの作り方〜
yasuhirokimesawa
1
180
20251012_社内でのMCT活動
ponponmikankan
1
860
採用ピッチ資料_キヨモトテックイチ
satoshi01
0
150
Featured
See All Featured
The Invisible Side of Design
smashingmag
302
51k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.3k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
Mobile First: as difficult as doing things right
swwweet
225
10k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.5k
Large-scale JavaScript Application Architecture
addyosmani
514
110k
Scaling GitHub
holman
463
140k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
Six Lessons from altMBA
skipperchong
29
4k
Gamification - CAS2011
davidbonilla
81
5.5k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
Transcript
Google AI モデル群 解体新書 Opal で使えるAI の能力と役割 1
はじめに:タスクに応じたAI の使い分け Opalなどのプラットフォームでは、様々な得意分野を持つAIモデルを利用できま す。 これらのモデルを 適材適所で組み合わせることで、シンプルなお手伝いから複雑な アプリケーションまで、あらゆるアイデアを実現できます。 本日は、主要なモデルを2つのカテゴリに分けて解説します。 1. テキスト・マルチモーダル系モデル
2. メディア生成系モデル 2
1. テキスト・マルチモーダル系モデル 言葉やデータを理解し、思考するAI 中心的な役割 テキストの理解、要約、生成、分析 マルチモーダルとは? テキストだけでなく、画像、音声、動画など、複数の種類の情報を同時に 扱える能力 主な用途 文章作成、データ分析、計画立案、対話など
3
Gemini 2.5 Flash 日常タスクを高速処理する、軽快なモデル 役割: 日常的なタスクや 高速な応答が得意なバランス型。 機能: 大量のタスクを低遅延で効率的に処理することに最適化。 最適な用途:
リアルタイム性が求められるチャットボット 文章の要約や分類 画像や動画のキャプション生成 4
Gemini 2.5 Pro 複雑なタスクをこなす、高性能な頭脳 役割: 複雑で高度な思考を必要とするタスクを実行。 機能: Flash より高度な推論、コーディング、マルチモーダル理解能力。 テキスト、コード、画像、音声、動画など、多様な入力を深く理解。
最適な用途: 専門的なレポートや記事の作成 複雑なデータ分析と洞察の抽出 アプリ開発のコーディング補助 5
Plan and Execute with Gemini 2.5 計画し、実行する「AI エージェント」 役割: 複雑なタスクを
自律的に計画し、実行する。 機能: 曖昧な指示を具体的なステップに分解。 必要なツール(他のAI、Web検索など)を自動で呼び出してタスクを遂 行。 例: 「競合他社の最新動向を調査してレポートを作成して」という指示だけ で、計画から実行までを自動化。 6
Deep Research with Gemini 2.5 特定分野を深掘りする「AI リサーチャー」 役割: 特定トピックに関する 詳細な調査とレポート生成。
機能: AIが自ら調査計画を立て、Webから信頼性の高い情報を収集・分析。 最終的に 出典リンク付きで、構造化された詳細なレポートを生成。 強み: 情報の信頼性が高く、ファクトチェックの手間を削減。 7
2. メディア生成系モデル テキストから、新たな創造物を生み出すAI 中心的な役割 画像、音声、動画、音楽といったメディアをゼロから生成 仕組み プロンプト(テキストによる指示)を解釈し、対応するメディアコンテン ツを生成 主な用途 アート制作、デザイン、BGM作成、動画コンテンツ制作など
8
Imagen 4 テキストから高品質な画像を生成 役割: プロンプトから フォトリアルな画像を生成。 機能: 非常にリアルで高解像度な画像を生成。 特に、 人物の骨格や手の描写、
画像内のテキスト表現の正確性に優れる。 最適な用途: 広告ビジュアルの作成 ブログやプレゼン資料の挿絵 アート作品の制作 9
Gemini 2.5 Flash Image 画像を生成し、さらに対話で「編集」する 役割: テキストと画像を基に、 画像の生成と編集を行う。 機能: Imagen
4 の生成能力に加え、 既存画像の編集が得意。 「この人物を消して」「背景を森に変えて」といった自然言語での対話的 な指示で画像を修正。 最適な用途: 写真のレタッチや修正 既存の画像をベースにしたコラージュ作成 10
AudioLM テキストから人間のようなスピーチを生成 役割: テキストを 自然な音声に変換。 機能: 入力されたテキストを、人間らしいイントネーションや感情で読み上げ る。 短い音声の「続き」を違和感なく生成することも可能。 最適な用途:
オーディオブックのナレーション 動画の吹き替え ポッドキャスト制作 11
Veo テキストや画像から高品質な動画を生成 役割: 指示に基づいて リアルな動画を生成。 機能: 物理法則や光の表現に優れた、シネマティックな動画を生成。 最新版では、動画の内容に合った 音声も同時に生成可能。 最適な用途:
製品のプロモーションビデオ コンセプトの可視化 ショート動画コンテンツの制作 12
Lyria 2 テキストからプロ品質の音楽を生成 役割: **楽器演奏の音楽(インストゥルメンタル)**を生成。 機能: 「壮大なオーケストラ」「落ち着いたジャズピアノ」といった指示だけで 音楽を生成。 プロ品質で、商用利用も可能なレベル。 最適な用途:
動画コンテンツのBGM作成 作曲や編曲のアイデア出し アプリやゲームの背景音楽 13
まとめ 適材適所のAI を組み合わせて、アイデアを形に 思考するAI: Gemini Flash, Pro, Plan/Execute, Deep Research
創造するAI: Imagen, Flash Image, AudioLM, Veo, Lyria これらのモデルの特性を理解し、組み合わせることで、 あなたのアイデアはより強力なアプリケーションへと進化します。 14