Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GPT-4-V解説
Search
giranaga
November 13, 2023
0
260
GPT-4-V解説
GPT-4-Vの公式ドキュメントの情報(
https://platform.openai.com/docs/guides/vision)を日本語訳し、簡単にまとめたスライドです
。
giranaga
November 13, 2023
Tweet
Share
Featured
See All Featured
Become a Pro
speakerdeck
PRO
29
5.5k
Imperfection Machines: The Place of Print at Facebook
scottboms
268
13k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Statistics for Hackers
jakevdp
799
220k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Balancing Empowerment & Direction
lara
3
620
Visualization
eitanlees
148
16k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Designing for humans not robots
tammielis
253
25k
Documentation Writing (for coders)
carmenintech
74
5k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
6k
Transcript
giranaga GPT-4-V詳細解説
目次 1. GPT-4-Vとは何か 2. GPT-4-Vの特徴 3. GPT-4-Vの制限 4. まとめ
GPT-4-Vとは何か ‧従来のGPT-4に画像をインプットできるようにしたもの。 ‧画像のリンクもしくはbase64エンコードされた画像を渡すことで利⽤できる。 ‧⾼解像度と低解像度モードを選択できる。 ‧以下のように「image_url」プロパティから指定する。 https://platform.openai.com/docs/guides/vision 公式ドキュメント :
GPT-4-Vの制限 ‧特定のオブジェクトの位置に関する質問には最適化されていない。 ‧画像の⾊に関する識別が難しい。 ‧⽇本語等の⾮アルファベットの識別が難しい。 ‧ステートレスなので、メッセージは⾃分で管理する必要がある。
まとめ ‧GPT-4-Vを使うことでこれまでのGPT-4に画像データを インプットできるようになる。 ‧有効に活⽤することでこれまでのGPT-4をさらに使いやすくできる。 ‧反⾯、限界もあるので適宜使い分ける必要あり。