Slide 7
Slide 7 text
機械学習ベンチマークにおけるラベルミスの特定
7
● 10種類の機械学習ベンチマークデータセットのテストデータにおけるラベルミスを特定
● 研究目的で広く一般に使われてきたベンチマークのテストデータに平均3.3%のラベルミスが存在
● 予算や時間の制約が厳しい実応用のデータセット構築ではラベルミスはさらに混入しやすくなる
1. Confident Learning*でラベルミスの可能性が高いサンプルを候補として特定
2. 全て or 一部の候補に対して実際にラベルミスかどうかをクラウドソーシングにより人間が確認
3. 2. の結果を基に各ベンチマークのテストデータにおけるラベルミスの割合を計算
特定されたラベルミスの例 各ベンチマークのテストデータにおけるラベルミスの割合
* C. Northcutt+, Confident learning: Estimating uncertainty in dataset labels, Journal of Artificial Intelligence Research, 2021
図表は論文からの引用(一部編集を含む)です