Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サーバレス基盤で Gemini の性能を引きだすアーキテクトを構築した話
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Kei Kishimoto
September 25, 2024
Technology
490
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
サーバレス基盤で Gemini の性能を引きだすアーキテクトを構築した話
Kei Kishimoto
September 25, 2024
Other Decks in Technology
See All in Technology
Building applications in the Gemini API family.
line_developers_tw
PRO
0
2.2k
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
3
220
DevOps Agentで始めるAWS運用 〜フロンティアエージェントが変える運用の現場〜
nyankotaro
1
320
Microsoft Build Keynoteふりかえり
tomokusaba
0
110
ITエンジニアを取り巻く環境とキャリアパス / A career path for Japanese IT engineers
takatama
4
1.8k
非定型業務をAI slackbotで自動化する ~ 社内要望を自動壁打ちするbotを作った ~/automating-ad-hoc-work-with-ai-slackbot
shibayu36
0
210
AgentGatewayを試してみたかった
tkikuchi
0
120
Mastering Ruby Box
tagomoris
3
150
TypeScript Compiler APIとPHP-Parserを活用し、TypeScriptとPHPで型を共有する
shuta13
0
370
EventBridge Connection
_kensh
5
650
LLMにもCAP定理があるという話
harukasakihara
0
100
AI フレンドリーなエラー監視を TypeScript で実現する
shinyaigeek
2
270
Featured
See All Featured
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.6k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
400
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.6k
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
160
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
210
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Marketing to machines
jonoalderson
1
5.4k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Done Done
chrislema
186
16k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
160
Transcript
| © Cloud Ace, Inc サーバレス基盤で Gemini の性能を引きだすアーキテクトを構築した話 議事録生成から次の活用へ
| © Cloud Ace, Inc この講演で伝えたいメッセージ • Google Cloud プロダクト間の連携が熱い •
Gemini も熱い
| © Cloud Ace, Inc 01 | はじめに 02 | Issue
の発見 03 | アーキテクチャの解説 04 | リクエスト上限の回避策 05 | 今後の活用 06 | 最後に Agenda
| © Cloud Ace, Inc 01 | はじめに
| © Cloud Ace, Inc 自己紹介 Kishimoto Kei (岸本 桂) クラウドエース株式会社
SRE部 所属 • Google Cloud の設計支援 • Google Cloud 歴 1 年弱 • Google Cloud 認定資格全冠 Antonnion2024
| © Cloud Ace, Inc 02 | Issue の発見
| © Cloud Ace, Inc Issue の発見 ※ 画像はサンプルです
| © Cloud Ace, Inc Issue の発見 お客様 営業担当 エンジニア 1
回目の会議 2 回目の会議 1 回目の会議にエンジ ニアは参加していない
| © Cloud Ace, Inc Issue の発見
| © Cloud Ace, Inc Issue の発見 手書きなのかなぁ 書き方に統一感な いなぁ
| © Cloud Ace, Inc Issue の発見 営業の同期 OKD に 相談してみよう
!!! ←営業の同期 OKD
| © Cloud Ace, Inc Issue の発見 お客様技術支援チャネルのメッセージって 手打ち? みんな手打ちだよ。 メッセージ作成するの
どれくらいの時間 かかるん? 早くて 10 分~15 分くらいかな? 大体そうだね 。 必要な情報て、会議議事録 と企業情報 くらい? 営業の同期 OKD 私
| © Cloud Ace, Inc Issue の発見 お客様技術支援チャネルのメッセージって 手打ち? みんな手打ちだよ。 メッセージ作成するの
どれくらいの時間 かかるん? 早くて 10 分~15 分くらいかな? 大体そうだね 。 必要な情報て、会議議事録 と企業情報 くらい? 営業の同期 OKD 私 大体 3 ステップでメッ セージは作成されて いる
| © Cloud Ace, Inc Issue の発見 1. お客様との会議 3. エンジニア同行依頼
2. 議事録作成と整理
| © Cloud Ace, Inc Issue の発見 これ 生成 AI 使えそう。
| © Cloud Ace, Inc 03 | アーキテクチャの解説
| © Cloud Ace, Inc アーキテクチャの解説(概要) Gemini 1.5 動画選択 リクエスト リクエスト時
| © Cloud Ace, Inc アーキテクチャの解説(概要) レスポンス レスポンス レスポンス時 動画の概要 この動画は
5 分間男 性が釣りをしている動 画です。・・・ Gemini 1.5
| © Cloud Ace, Inc Google Cloud で構築してみた
| © Cloud Ace, Inc 利用したプロダクト説明 実行環境 • コンテナ化されたアプリケーションをサーバレ スで実行。リクエストに応じて自動スケーリン グ。
オブジェクト ストレージ • 非構造化データを保存するためのストレー ジ。保存できるデータ量は無制限。 Cloud Run Cloud Storage
| © Cloud Ace, Inc 利用したプロダクト説明 負荷分散 • ユーザーからのリクエストを複数のバックエン ドに分散することで、アプリケーションに対す るパフォーマンス低下のリスクを低減。
アクセス制御 • アカウントベースでアクセス制御が可能であ り、ここでは Cloud Load Balancing に設定。 Cloud Load Balancing Identity Aware Proxy
| © Cloud Ace, Inc アーキテクチャ図 Cloud Run Cloud Load Balancing
Cloud Storage Clients Identity-Aware Proxy
| © Cloud Ace, Inc アーキテクチャ図 Cloud Run Cloud Load Balancing
Cloud Storage Clients Identity-Aware Proxy アカウントで認証 録画とプロンプトを Gemini 1.5 にリクエスト 録画とプロンプトを Gemini 1.5 にリクエスト Cloud Storage に録画を保存 リクエスト時
| © Cloud Ace, Inc アーキテクチャ図 Cloud Run Cloud Load Balancing
Cloud Storage Clients Identity-Aware Proxy レスポンス表示 Gemini 1.5 からのレスポンス レスポンス時
| © Cloud Ace, Inc 04 | リクエスト上限の回避策
| © Cloud Ace, Inc リクエスト上限の回避策 Gemini 1.5 Cloud Run ブラウザ
アプリサーバ ❌ リクエスト上限 Cloud Storage 容量が大きい動画をリクエストすることができない (32 MB まで) 課題
| © Cloud Ace, Inc リクエスト上限の回避策 Gemini 1.5 Cloud Run ブラウザ
アプリサーバ Cloud Storage 署名付き URL : リクエスト時に限定された権限と 有効期限が設定された URL のこと 解決① ①署名付き URL ②動画アップロード
| © Cloud Ace, Inc リクエスト上限の回避策 Gemini 1.5 Cloud Run ブラウザ
アプリサーバ Cloud Storage 署名付き URL : リクエスト時に限定された権限と 有効期限が設定されたURLのこと 解決① ③リクエスト ③リクエスト ④参照
| © Cloud Ace, Inc リクエスト上限の回避策 Gemini 1.5 ブラウザ アプリサーバ Cloud
Storage HTTP/2 : Cloud Run では HTTP/2 を使用する場 合、リクエスト上限は無制限 解決② Cloud Run HTTP/2 HTTP/1 Nginx App
| © Cloud Ace, Inc リクエスト上限の回避策 署名付き URL HTTP/2 通信 27
分(317 MB)の 動画アップロード速度 約 28 秒 約 27 秒 必要な設定 署名付き URL の処理必要 Cloud Run の設定変更必要
| © Cloud Ace, Inc まとめ これまで • 議事録から個人が各フォーマット でプリセールス依頼文を作成 導入すると...
• Gemini が会議の録画から決まっ たフォーマット でプリセールス依頼 文を作成 これまで 導入すると ...
| © Cloud Ace, Inc 05 | デモンストレーション
| © Cloud Ace, Inc アプリケーション イメージ
| © Cloud Ace, Inc 動画(1 min)
| © Cloud Ace, Inc 05 | 今後の活用
| © Cloud Ace, Inc 今後の活用 時刻 出来事 0:10 - 0:15
男性が立ち上がり、周りを見渡しています。 1:05 - 1:12 小さなアタリがあったが、すぐに外れました。 2:30 - 2:34 海面がざわつき、風が強くなる。 3:45 - 3:50 大きな波で船が揺れる。釣り竿が倒れそうにな る。 4:45 - 4:55 大きな魚がかかるが、船が揺れて失敗する。 利用者:動画編集をしている方 利用方法:長時間の動画からイベントのみ動画を切り取らせる Ex 釣りをしている動画
| © Cloud Ace, Inc 今後の活用 利用者:ペットホテルの運営会社 利用方法:10 分に 1 回ペットの行動を観察しチャットにて報告
Ex ペットショップの監視カメラ 水は何回飲みましたか? ペットホテル 10 分間外を眺めています。 眠りにつきました。 既読 16:40 既読 16:30 2 回飲みました。 既読 16:50 既読 16:45
| © Cloud Ace, Inc 今後の活用 利用者:動画からクリエイティブな記事や手順書を作成する方 利用方法:元となる動画から叩き台となる文書の作成 Ex サッカーの試合、製品組み立て動画 チーム
A vs チーム B:白熱した 攻防が織りなす 90 分の激闘 9 月 11 日、満員のスタジアムで 行われたリーグ戦第 15 節、チー ム A とチーム B が激突した。両 チームとも今季絶好調であり、こ の試合は優勝争いを占う重要な 一戦となった。 ・ ・ ・
| © Cloud Ace, Inc (他モデルとの比較)Gemini の凄さ
| © Cloud Ace, Inc GPT-4o GPT-4o mini Gemini 1.5 Pro
Gemini 1.5 Flash Claude 3.5 Sonnet 最大入力トークン数 128,000 128,000 2,097,152 1,048,576 200,000 最大出力トークン数 16,384 16,384 8,192 8,192 4,096 マルチモーダル対応 画像 画像 動画・画像・音声 動画・画像・音声 画像 入力費用 (ドル/ 100 万トークン ) 2.5 0.15 1.25 0.01875 3 出力費用 (ドル/ 100 万トークン ) 10 0.6 3.75 0.075 15 利用方法 API キー API キー サービス アカウント サービス アカウント サービス アカウント
| © Cloud Ace, Inc 06 | 最後に
| © Cloud Ace, Inc まとめ • 動画や音声など生成 AI に与えられる情報が多く なったことで、組み合わせ次第では業務効率やユー
ザー体験向上が期待できる • 今回のサーバレス サービスを用いた生成 AI 活用 例を参考に、社内での活用をご検討いただければ 幸いです ※Google Cloud、Gemini、Google Cloud Storage は Google LLC の商標です。 ※GPT-4o は OpenAI OpCo, LLC の商標です。