Slide 5
Slide 5 text
5
データカスケード [Sambasivan+, CHI 2021]
• データカスケードの蔓延:インタビュー参加
者53名のAI実務者の92%が1回以上、45.3%が
2回以上のデータカスケードを経験
[Sambasivan+, CHI 2021] “Everyone wants to do the model work, not the data work”: Data Cascades in High-Stakes AI
データカスケード:データの問題から生じる
負の影響が連鎖的に下流に波及していく事象
• データ作業の軽視:データ収集やアノテー
ションなどの作業はモデル開発と比較して、
成果が適切に評価されづらく、インセン
ティブ(報酬や学術的成果など)が不足し
ているため、軽視される傾向にある。
• データカスケードの原因:現実世界との乖離、
応用ドメイン領域の知識不足、相反する報酬
システム、組織間におけるドキュメント不足
により発生