Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GPT-4-V解説
Search
giranaga
November 13, 2023
0
280
GPT-4-V解説
GPT-4-Vの公式ドキュメントの情報(
https://platform.openai.com/docs/guides/vision)を日本語訳し、簡単にまとめたスライドです
。
giranaga
November 13, 2023
Tweet
Share
Featured
See All Featured
The Cost Of JavaScript in 2023
addyosmani
55
9.3k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
1
87
The Art of Programming - Codeland 2020
erikaheidi
56
14k
For a Future-Friendly Web
brad_frost
180
10k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.1k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
How to Think Like a Performance Engineer
csswizardry
28
2.3k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.8k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
970
Site-Speed That Sticks
csswizardry
13
990
Transcript
giranaga GPT-4-V詳細解説
目次 1. GPT-4-Vとは何か 2. GPT-4-Vの特徴 3. GPT-4-Vの制限 4. まとめ
GPT-4-Vとは何か ‧従来のGPT-4に画像をインプットできるようにしたもの。 ‧画像のリンクもしくはbase64エンコードされた画像を渡すことで利⽤できる。 ‧⾼解像度と低解像度モードを選択できる。 ‧以下のように「image_url」プロパティから指定する。 https://platform.openai.com/docs/guides/vision 公式ドキュメント :
GPT-4-Vの制限 ‧特定のオブジェクトの位置に関する質問には最適化されていない。 ‧画像の⾊に関する識別が難しい。 ‧⽇本語等の⾮アルファベットの識別が難しい。 ‧ステートレスなので、メッセージは⾃分で管理する必要がある。
まとめ ‧GPT-4-Vを使うことでこれまでのGPT-4に画像データを インプットできるようになる。 ‧有効に活⽤することでこれまでのGPT-4をさらに使いやすくできる。 ‧反⾯、限界もあるので適宜使い分ける必要あり。