Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GPT-4-V解説
Search
giranaga
November 13, 2023
0
290
GPT-4-V解説
GPT-4-Vの公式ドキュメントの情報(
https://platform.openai.com/docs/guides/vision)を日本語訳し、簡単にまとめたスライドです
。
giranaga
November 13, 2023
Tweet
Share
Featured
See All Featured
Code Review Best Practice
trishagee
74
19k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
1
46
Digital Ethics as a Driver of Design Innovation
axbom
PRO
0
140
A Modern Web Designer's Workflow
chriscoyier
698
190k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
720
New Earth Scene 8
popppiees
0
1.3k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
360
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
0
990
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
89
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Context Engineering - Making Every Token Count
addyosmani
9
580
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
46
Transcript
giranaga GPT-4-V詳細解説
目次 1. GPT-4-Vとは何か 2. GPT-4-Vの特徴 3. GPT-4-Vの制限 4. まとめ
GPT-4-Vとは何か ‧従来のGPT-4に画像をインプットできるようにしたもの。 ‧画像のリンクもしくはbase64エンコードされた画像を渡すことで利⽤できる。 ‧⾼解像度と低解像度モードを選択できる。 ‧以下のように「image_url」プロパティから指定する。 https://platform.openai.com/docs/guides/vision 公式ドキュメント :
GPT-4-Vの制限 ‧特定のオブジェクトの位置に関する質問には最適化されていない。 ‧画像の⾊に関する識別が難しい。 ‧⽇本語等の⾮アルファベットの識別が難しい。 ‧ステートレスなので、メッセージは⾃分で管理する必要がある。
まとめ ‧GPT-4-Vを使うことでこれまでのGPT-4に画像データを インプットできるようになる。 ‧有効に活⽤することでこれまでのGPT-4をさらに使いやすくできる。 ‧反⾯、限界もあるので適宜使い分ける必要あり。