4/19
えらい人の都合 in データ
多くの研究はアノテーターの主観に焦点を当てているが本当にそれが問題?
→ 上位にいる他者の関心、価値、優先順位に深く影響されていた
Between Subjectivity and Imposition: Power Dynamics in Data Annotation for Computer Vision (CSCW'20)
Slide 5
Slide 5 text
5/19
素人でも玄人並みのアノテーションは可能?
政治的発言の誤報識別タスクで概ね専門家と類似したアノテーション結果
また、ワーカーのグループ化が有用であることも示唆
→ ただし、暗黙的な政治的志向が真偽の判断品質に影響するので注意
(明示的な政治スタンスとは関係なく)
Can The Crowd Identify Misinformation Objectively? The Effects of Judgment Scale and Assessor's Background (SIGIR'20)
Slide 6
Slide 6 text
6/19
違う視点を知ればバイアスは軽減できる?
違う視点を持つ人と一緒にアノテーションをしてもあまり変化はなし
→ 単に違う視点を知るだけではバイアス軽減には至らない
Does Exposure to Diverse Perspectives Mitigate Biases in Crowdwork? An Explorative Study (HCOMP'20)
Slide 7
Slide 7 text
7/19
肌の色が違えばいろいろ違ったものに
画像に存在するバイアスを「肌の色が明るい人 or 暗い人」で調査
→ キャプションの正確さ、感情や単語の選択に違い
また、キャプションシステムが最新かどうかで大きな差
Understanding and Evaluating Racial Biases in Image Captioning (ICCV'21)
Slide 8
Slide 8 text
8/19
うーんたぶんこれは真実かな(N回目)
公開されているクラウドソーシングデータの系統的探索分析を実施
→ 認知バイアスのほか、科学に対する信念が影響する可能性を示唆
また、一般的に真実性を過大評価する傾向
The Effects of Crowd Worker Biases in Fact-Checking Tasks (FaccT'22)
Slide 9
Slide 9 text
9/19
言論の有害性の評価において
アノテーターのアイデンティティや信条が強く影響
→ 特に、保守的だったり人種差別的信念のスコアが高いアノテーターは
黒人へのヘイトスピーチを無害と評価する一方、アフリカ英語を有害と評価
"標準"じゃないのは有害?
Annotators with Attitudes: How Annotator Beliefs And Identities Bias Toxic Language Detection (NAACL'22)
15/19
Webページの質判断にどういった要因が影響するか
→ 時間帯や曜日が大きく影響することを示し
影響を軽減するための方策を指南
アノテーションに効いてくるバイオリズム
The Crowd is Made of People: Observations from Large-Scale Crowd Labelling (CHIIR'22)
Slide 16
Slide 16 text
16/19
(1)オブジェクト、(2)人物、(3)地理の3つの次元に沿って
潜在的な偏りを可視化するツールを開発
→ 「ではどうすればよいか?」も提案し、早期のバイアス軽減へ
どれくらい偏ってるか、見れば分かるよね?
REVISE: A Tool for Measuring and Mitigating Bias in Visual Datasets (IJCV'22)
Slide 17
Slide 17 text
17/19
逐次的な意思決定において、
アンカリングの影響を捕捉し提示アイテムを動的に決定する手法を提案
→ リアルタイムでバイアスを軽減しながらの評価収集を実現
さっき見たものの影響をどけたい
AI-Moderated Decision-Making: Capturing and Balancing Anchoring Bias in Sequential Decision Tasks (CHI'22)
Slide 18
Slide 18 text
18/19
画像内の顔に難読化処理を施す
→ 人種等の(不必要な)影響を軽減しつつ、
難読化済みデータで学習したモデルの性能低下は1%以下程度に抑えられた
XX人がいるから〇〇を避けるために
A Study of Face Obfuscation in ImageNet (ICML'22)