著名なModel-Centric AIのベンチマーク(例:MNIST, ImageNet) でモデルは人間の能力を超え、飽和状態にある 人間の精度を0とした時のモデルの精度の変遷 [2207.10062] DataPerf: Benchmarks for Data-Centric AI Development
AI Competitionからはじまっている ▪ ICML2022でワークショップを開催 ▪ 2023年3月末にコンペを公開 [2207.10062] DataPerf: Benchmarks for Data-Centric AI Development Data-centric ML benchmarking: Announcing DataPerf’s 2023 challenges – Google AI Blog
creation:学習データセットを作る 2. Test set creation:テストデータセットを作る 3. Data selection:学習データを減らす 4. Data debugging:学習データの間違いを見つける 5. Data valuation:学習データを増やすために質を見積もる 6. Slice discovery:苦手なサブグループを見つける