Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GPT-4-V解説
Search
giranaga
November 13, 2023
0
260
GPT-4-V解説
GPT-4-Vの公式ドキュメントの情報(
https://platform.openai.com/docs/guides/vision)を日本語訳し、簡単にまとめたスライドです
。
giranaga
November 13, 2023
Tweet
Share
Featured
See All Featured
Optimizing for Happiness
mojombo
379
70k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
21k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
283
13k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
The Cost Of JavaScript in 2023
addyosmani
51
8.7k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
5.9k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
1k
Navigating Team Friction
lara
188
15k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
860
Optimising Largest Contentful Paint
csswizardry
37
3.4k
Transcript
giranaga GPT-4-V詳細解説
目次 1. GPT-4-Vとは何か 2. GPT-4-Vの特徴 3. GPT-4-Vの制限 4. まとめ
GPT-4-Vとは何か ‧従来のGPT-4に画像をインプットできるようにしたもの。 ‧画像のリンクもしくはbase64エンコードされた画像を渡すことで利⽤できる。 ‧⾼解像度と低解像度モードを選択できる。 ‧以下のように「image_url」プロパティから指定する。 https://platform.openai.com/docs/guides/vision 公式ドキュメント :
GPT-4-Vの制限 ‧特定のオブジェクトの位置に関する質問には最適化されていない。 ‧画像の⾊に関する識別が難しい。 ‧⽇本語等の⾮アルファベットの識別が難しい。 ‧ステートレスなので、メッセージは⾃分で管理する必要がある。
まとめ ‧GPT-4-Vを使うことでこれまでのGPT-4に画像データを インプットできるようになる。 ‧有効に活⽤することでこれまでのGPT-4をさらに使いやすくできる。 ‧反⾯、限界もあるので適宜使い分ける必要あり。