Slide 5
Slide 5 text
テーマ:GPT-4Vで画像認識は終わるのか
大規模言語モデル(LLM)をはじめとした基盤モデルの波が画像認識分野にも
波及し、マルチモーダル基盤モデルの時代を迎えつつある
マルチモーダル基盤モデルは高い性能と柔軟さを兼ね備え、
今までの個別タスクによるベンチマーキングを覆すインパクトを与えつつある
5
1990年代
画像処理
計測・抽出の時代
2000年代
統計的パターン認識
特徴量設計の時代
2010年代
深層学習
アーキテクチャ設計の時代
第1回SSII(1995)
↓
2020年代
基盤モデル
→次のトレンドは?
第30回SSII(2024)
↓
GPT-4Vによって画像認識は終わるのか?どう変わるのか?