SIGIR2022 Paper (Optimizing generalized Gini indices for fairness in rankings)

Slide 1

Slide 1 text

Optimizing generalized Gini indices for fairness in rankings IR Reading 2022 秋株式会社ビズリーチ中江俊博 2022-11-12

Slide 2

Slide 2 text

自己紹介中江俊博 (なかえとしひろ) 株式会社ビズリーチリクルーティングプロダクト本部プラットフォーム開発部 AI1グループ Mgr 経歴 NTTデータ数理システム(-2018) データ分析コンサルタント TripleW(2018-2019) 排尿予測モデル実装ビズリーチ (2019-現職) 推薦モデルなどの機械学習関連の実装の統括担当 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness 2

Slide 3

Slide 3 text

今回対象となる論文 Optimizing generalized Gini indices for fairness in rankings Virginie Do, Nicolas Usunier (Meta AI Research) SIGIR 2022 この論文のベースになる同一著者の論文が NeurIPS2021 で出ている Two-sided fairness in rankings via Lorenz dominance 要旨レコメンドにおいてItemに対するpreferenceが与えられた状況で、 User側のutilityの和と、ItemのGini係数(の拡張 ; GGFs)の和が最良になる fair なランキングの手法を提案。前年の論文で、微分可能な関数による手法を提案していた。今回の論文で、微分不可能な Gini係数を、微分可能な関数の手法に帰着させることで解決を図る、という筋書。 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 3

Slide 4

Slide 4 text

前提 User に Item を確率的にレコメンド ... User が Item にもつ価値 ... User に対して Item が番目にお薦めされる確率 ... User が番目にお薦めの Item に接触する確率 (単調減少) User の utility : 価値の高いアイテムほど上位に出ていればutility大きい Item の exposure : アイテムが上位にレコメンドされる頻度が多いほどexposure大きいを Fix した状態でを動かし、 utility / exposure を増やすようにする問題と考える。 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 4

Slide 5

Slide 5 text

Lorenz efficiency Generalized Lorenz Curve utility を低いほうから累積和をとったもの(図はNeurIPS2021) 下に突き出ているほど不平等青 : user utility の総和 max → itemが不平等赤 : user も item もまだ上に持っていける余地がある。 Lorenz efficiency user/item いずれも curve を上側に改善できない状態論文著者にとっての fairness の定義 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 5

Slide 6

Slide 6 text

Lorenz efficiency を見つける増加とともに効果が低減するような関数の次の線形和を最大にするは、Lorenz efficiency を満たす！は事前に決めたパラメータ IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 6

Slide 7

Slide 7 text

Frank-Wolf アルゴリズムの適用は確率行列(tensor)なので、で和をとると1になる制約を満たす必要がある。この場合、凸集合での微分可能な関数を最適化する手法である Frank-Wolfアルゴリズムが使える Step 1: Step 2 : Step 3 : Step1 の argmax の見つけ方微分を計算の User ごとの降順ソートに対応する置換行列が argmax を満たしている！置換行列が確率行列(tensor)であることに注意。 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 7

Slide 8

Slide 8 text

GGFs 同じ手続きを item exposure の Gini 係数最小化に使えないか？これが SIGIR2022 論文の目標！ Generalized Gini welfare Functions (GGFs) 非増加の重み列をパラメータとする関数次元の入力について昇順ソートを使って次のように定義される。特に item exposure に対する gini 係数は、 GGFsを使った次の値を最大化することと(ほぼ)等価 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 8

Slide 9

Slide 9 text

GGFs と Lorenz efficiency 例えば次の関数を最大にするレコメンドは、 user utility / item gini 係数のバランスをとることができる。 GGFs の線形和の形となっている ( はパラメータ) 実は GGFs の線形和の形の関数を最大にするレコメンドは、 Lorenz efficiency を満たしているでは、そのようなをさっきと同じように微分で求めよう！残念！ GGFs は単純に微分できない (昇順ソートがあるから) IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 9

Slide 10

Slide 10 text

GGFsの最適化骨子 : Step1/2 の繰り返し (上下幅を縮めながら) Step1. 微分可能な関数で上下を挟み、挟んだ関数上で微分 Step2. 微分をつかって Frank-Wolf でを Update 上下を挟むなめらかな関数 (モーロー包 ; Moreau envelope) 微分不可能な関数に対して次のは比較的簡単な手続きで微分できる。計算できた部分を使って、GGFsの線形和全体の微分を算出これをソートして、更新して... IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 10

Slide 11

Slide 11 text

数値実験 : 条件対象データ : Lastfm-2k, MovieLens-20m を対象 user-item preference は行列分解から算出ランクごとの接触重みは DCG を利用比較手法 FairRec(*) : Userが順に1つずつとる(先取り)ドラフト会議方式微分可能な関数による方法 welf : NeurIPS(2021)で提案された減衰関数を使う。 eq. exposure (stf) : item exposure の分散を使う (Giniっぽい) GGF : 提案法 GGFについては、utility が小さい user に重みを付ける two-side fairness を考慮した計算も実施。 (*) Patro+(2020), FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms (WWW2020, arxiv/2002.10764) IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 11

Slide 12

Slide 12 text

数値実験結果 : Lastfm-2k 左 : user については utility の合計を max にする場合右 : user については utility の小さい 25% に重みを付ける場合いずれも user/item のバランスを変化させた結果をプロット GGF のパレート曲線がいずれも左上に来ている (最適手法) IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 12

Slide 13

Slide 13 text

まとめ user/item 両方の Lorenz 曲線が改善できない = fairであるこれを Lorenz efficiency という GGFs を使った user/item の fairness を考慮したランキングを提案 GGFs の和を最大にするランキングは Lorentz efficiency を満たす本来微分不可能な関数である GGFs を、微分可能な関数で近似できる近似した関数での微分を使って、Frank-Wolfで最適化できる GGFs を使ったランキングは従来手法より、 user utility /item exposure を改善 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 13