GPT-4-V解説
by
giranaga
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
giranaga GPT-4-V詳細解説
Slide 2
Slide 2 text
目次 1. GPT-4-Vとは何か 2. GPT-4-Vの特徴 3. GPT-4-Vの制限 4. まとめ
Slide 3
Slide 3 text
GPT-4-Vとは何か ‧従来のGPT-4に画像をインプットできるようにしたもの。 ‧画像のリンクもしくはbase64エンコードされた画像を渡すことで利⽤できる。 ‧⾼解像度と低解像度モードを選択できる。 ‧以下のように「image_url」プロパティから指定する。 https://platform.openai.com/docs/guides/vision 公式ドキュメント :
Slide 4
Slide 4 text
GPT-4-Vの制限 ‧特定のオブジェクトの位置に関する質問には最適化されていない。 ‧画像の⾊に関する識別が難しい。 ‧⽇本語等の⾮アルファベットの識別が難しい。 ‧ステートレスなので、メッセージは⾃分で管理する必要がある。
Slide 5
Slide 5 text
まとめ ‧GPT-4-Vを使うことでこれまでのGPT-4に画像データを インプットできるようになる。 ‧有効に活⽤することでこれまでのGPT-4をさらに使いやすくできる。 ‧反⾯、限界もあるので適宜使い分ける必要あり。