Introduction to Fairness Aware Learning

Introduction to Fairness Aware Learning Asei Sugiyama

要旨 Fairness Aware Machine Learning は機械学習による不平等な意思決定を修正するための活動歴史的には、人間による主観評価から客観的な評価基準を導入したことで差別が減少したものの、データに基づく評価には依然として人種的な差別が存在することに対する問題定期がきっかけ
望ましい状況からの逸脱度合いを損失として定義し、最小化することで取り組みは可能一方、いくつかの根本的な課題は依然として存在する

TOC 1. Fairness のこれまで <- 2. Fairness の定式化 3. 論文
"Equality of Opportunity in Supervised Learning" の紹介 4. 現状の問題点 5. まとめ

Fairness のこれまで NeurIPS (NIPS) 2017 Tutorial と神嶌先生の Fairness-Aware Machine Learning
and Data Mining からかんたんに流れを抜粋

Fairness のこれまで Fairness の対象領域人間による主観評価自動判定の導入自動判定に潜む差別 COMPAS Fairness Aware
Machine Learning 深層生成モデル & Fairness

Fairness の対象領域規制されている領域クレジットの与信教育雇用住宅ローン公共施設広告やマーケティングも nips17tutorial

人間による主観評価 (職務履歴書を送付したときの)コールバック率は、白人っぽい名前のほうが黒人っぽい名前よりも 50% も高い黒人の経験した差別の度合いは過去 25
年に渡って変化がない nips17tutorial

自動判定の導入ローンにおける自動判定の導入マイノリティや低所得者の承認率が 30%向上デフォルト(債務不履行)予測の精度が向上 nips17tutorial

自動判定に潜む差別マイノリティはそもそもローンを受けにくいデフォルト予測においてローンが通った人だけを対象に学習すると、マイノリティのデータが少なくなってしまう Fairness-Aware Machine
Learning and Data Mining p.16

COMPAS (1/2) 再犯予測システム 2016 年に報道機関 Propublica が COMPAS の判断結果に人種差別がある
と報道高リスク判定が黒人に偏って算出されることが判明した Fairness-Aware Machine Learning and Data Mining p.20

COMPAS (2/2) 調査者と製作者の意見が対立調査者: 偽陽性と偽陰性に基づくと差別的製作者: 同一スコアの人は人種によらず再犯確率は同じ数理的にはこの
2 つを同時に満たせないことが知られている Fairness の定義について議論にアルゴリズムの判断はいつ差別になるのか : COMPAS 事例を参照して

Fairness Aware Machine Learning Fairness への取り組みが加速 PAIR @ Google の設立
(2017) NeurIPS (NIPS) 2017 Tutorial Fairness-Aware Machine Learning: Practical Challenges and Lessons Learned (KDD'19 Fairness Tutorial) KDD'19 Fairness Tutorial & PAIR: the People + AI Research Initiative

深層生成モデル & Fairness 解像度を落としたオバマ大統領の画像を高解像度化すると白人に人種を収集しなくてもデータセットそのものにバイアスがあった例

TOC 1. Fairness のこれまで 2. Fairness の定式化 <- 3. 論文
"Equality of Opportunity in Supervised Learning" の紹介 4. 現状の問題点 5. まとめ

Fairness の定式化主に神嶌先生の Fairness-Aware Machine Learning and Data Mining から抜
粋

Fairness の定式化登場する概念の準備センシティブな特徴の例 Formal Fairness 最小化問題としての定式化

登場する概念の準備 : 個人の特徴量 or : センシティブな特徴 : 目的変数
: 予測器 X A S Y R = R(X, A) Fairness-Aware Machine Learning and Data Mining p.27

センシティブな特徴 (1/2) 人種肌の色性別宗教出身国市民権年齢
nips17tutorial

センシティブな特徴 (2/2) 妊娠結婚歴障害の度合い従軍経験地理的な情報 etc. nips17tutorial

Formal Fairness Fairness through Unawareness Statistical Parity / Independence Equialized
Odds / Separation Equal Opportunity / Sufficiency Fairness-Aware Machine Learning and Data Mining p.40

Fairness through Unawareness (1/2) 同じ特徴ならセンシティブな特徴に依存せず同じ予測結果 Fairness-Aware
Machine Learning and Data Mining p.41

Fairness through Unawareness (2/2) 一見良さそう実際は不十分 S が変化したときに予測結果が変化
Fairness-Aware Machine Learning and Data Mining p.42

Independence (1/2) 次の2つが独立モデルの推論結果センシティブな特徴 Fairness-Aware Machine Learning
and Data Mining p.44

Independence (2/2) : 人種 : 破産予測人種によって予測結果の割合が変わるのは不平等
S Y ^ Fairness-Aware Machine Learning and Data Mining p.45

Separation 偽陽性/偽陰性に着目 : 人種 : 破産予測 : 完済/破産偽陽性/偽陰性
の確率は人種間で等しくあるべき S Y ^ Y Fairness-Aware Machine Learning and Data Mining p.47

Sufficiency precision に着目 : 人種 : 破産予測 : 完済/破産
正しく予測できた確率は人種間で等しくあるべき S Y ^ Y Fairness-Aware Machine Learning and Data Mining p.49

最小化問題としての定式化「Fair な状態」を「Unfair でない状態」ととらえ Unfairness を定義 Unfairness を損失として捉え、最小化問題に帰着好きな方法で解く (Bayes
最適化など) [1610.02413] Equality of Opportunity in Supervised Learning

因果推論としての定式化 , , , の間の関係を DAG として記述し整理することもできる Counterfactual Fairness で因果推論としての定式化がなされている
X A R Y

TOC 1. Fairness のこれまで 2. Fairness の定式化 3. 論文 "Equality
of Opportunity in Supervised Learning" の紹介 <- 4. 現状の問題点 5. まとめ

Equality of Opportunity in Supervised Learning NeurIPS (NIPS) 2016 教師あり学習における、センシティブな情報に基づく差別の度合いの尺
度を提案提案した尺度を用いて後処理を行うことにより、差別を除去提案した手法を FICO のクレジットスコアに適用することにより、有効性を検証

Equality of Opportunity in Supervised Learning FICO Score 問題の定式化提案手法
Case Study: FICO scores

FICO Score クレジットカードの与信スコアを提供するサービスさまざまな特徴に基づきスコアを算出 620 点がしきい値に使われるこのとき、82% が返済する (18% が債務不履行)
算出に用いる特徴のなかにセンシティブなものが含まれるセンシティブな特徴のうち、今回は人種に着目

問題の定式化これまでに述べたものに同じ : 個人の特徴量 : センシティブな特徴 : FICO スコアの予測値 :
ローン付与可能 (1) 不可能 (0) R の値がしきい値以上かどうかで可能、不可能を決める : 完済 (1) デフォルト (0) X A R = R(X, A) Y ^ Y

提案手法通常のローン完済の予測モデルを作成し、しきい値を後処理で調整 Fair なときに小さな値を取るような損失を定義し、その期待値を最小化するよう、ローン付与可否のしきい値を調整 [1610.02413] Equality of Opportunity in
Supervised Learning

Case Study: FICO scores 基礎分析 (Fig. 7) 異なる Fairness の定義
FICO Score のしきい値を 620 にした場合 (Fib. 8) 異なる Fairness で人種ごとのしきい値を可視化 (Fig. 9) それぞれの人種で精度比較 (Fig. 10) ローン付与/ローン完済の割合の比較 (Fig. 11)

基礎分析 (Fig. 7) FICO score - 破産確率 (上図) を見ると、同じスコアが与えられたときの
破産確率は人種にかかわらず同じ累積密度分布 (下図) を見ると、黒人やヒスパニックのほうが、アジア系や白人よりもスコアが低い傾向にある [1610.02413] Equality of Opportunity in Supervised Learning

基礎分析 (Fig. 7)

異なる Fairness の定義 (1/2) Max profit: Fairness を考えず、82% の人が完済するようなしきい値を人種ごとに設ける
Race blind: 全体の 82% が完済するようなしきい値を人種横断で使う

異なる Fairness の定義 (2/2) Demographic parity: 各人種でローンの付与される割合がおなじになるよう、しきい値を調整する Equal opportunity:
ローンが付与された人のうち、完済する人の割合がおなじになるよう、各人種でしきい値を調整 Equalized Odds: ローンが付与された人のうち完済した人の割合も完済しなかった人の割合も同じになるように、各人種でしきい値を調整

FICO Score のしきい値を 620 にした場合 (Fib. 8) 上図: FICO スコア
620 点を人種によらずしきい値とした場合下図: 横軸を FICO スコアから FICO スコアのパーセンタイル値に変えた場合曲線の下の面積: それぞれの人種において完済した人のうち、FICO スコアが 620 となった人の割合 [1610.02413] Equality of Opportunity in Supervised Learning

FICO Score のしきい値を 620 にした場合 (Fib. 8) ローンが通った割合は黒人で上位20%弱、アジア系で上位60%超

異なる Fairness で人種ごとのしきい値を可視化 (Fig. 9) Fairness の定義によって大きくしきい値が異なる

それぞれの人種で精度比較 (Fig. 10) それぞれの人種ごとに ROC カーブを描いた図

それぞれの人種で精度比較 (Fig. 10) 白人は予測精度が良いアジア系はローンが付与されがちなのに相対的に予測精度が低い黒人はローンが付与されないのにアジア系よりも予測
精度が良い

ローン付与/ローン完済の割合の比較 (Fig. 11) それぞれの Fairness の与え方ごとに、ローンを完済した人のうち、ローンが付与される人の割合を示した図
Opportunity はこの割合が人種間で平等になる

ローン付与/ローン完済の割合の比較 (Fig. 11) 横軸: Max profit 基準でローンが付与された人のうち完済した人の割合
縦軸: Max profit 基準でローンが付与された人の割合曲線: 割合の変化を、それぞれの基準についてとったもの Max profit 基準と一致すると右上へと膨らんだ曲線になる

of Opportunity in Supervised Learning" の紹介 4. 現状の問題点 <- 5. まとめ

現状の問題点 Fairness という単一の基準は存在しない定式化によって、結果が大きく変わってしまうセンシティブな属性情報に基づく調整が必要

Fairness という単一の基準は存在しないドメインに大きく依存し、単一の正解はない次善策として、Unfairness を自分で考え最小化しなければいけない定式化によって結果が大きく変わってしまう定式化しだいでは意図しない結果となってしまう

センシティブな属性情報に基づく調整が必要センシティブな属性情報に基づいて調整しないと Fairness に近づけないユーザーが情報提供してくれるとは限らない法的な規制の結果、収集自体が難しい
画像は暗黙的にセンシティブな属性情報を含む

of Opportunity in Supervised Learning" の紹介 4. 現状の問題点 5. まとめ <-

Recap Fairness Aware Machine Learning は機械学習による不平等な意思決定を修正するための活動歴史的には、人間による主観評価から客観的な評価基準を導入したことで差別が減少したものの、データに基づく評価には依然として人種的な差別が存在することに対する問題定期がきっかけ
望ましい状況からの逸脱度合いを損失として定義し、最小化することで取り組みは可能一方、いくつかの根本的な課題は依然として存在する

Introduction to Fairness Aware Learning

Introduction to Fairness Aware Learning

More Decks by Asei Sugiyama

Other Decks in Technology

Featured

Transcript