Slide 1

Slide 1 text

Optimizing generalized Gini indices for fairness in rankings IR Reading 2022 秋 株式会社ビズリーチ 中江 俊博 2022-11-12

Slide 2

Slide 2 text

自己紹介 中江 俊博 (なかえ としひろ) 株式会社ビズリーチ リクルーティングプロダクト本部 プラットフォーム開発部 AI1グループ Mgr 経歴 NTTデータ数理システム(-2018) データ分析コンサルタント TripleW(2018-2019) 排尿予測モデル実装 ビズリーチ (2019-現職) 推薦モデルなどの機械学習関連の 実装の統括担当 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness 2

Slide 3

Slide 3 text

今回対象となる論文 Optimizing generalized Gini indices for fairness in rankings Virginie Do, Nicolas Usunier (Meta AI Research) SIGIR 2022 この論文のベースになる同一著者の論文が NeurIPS2021 で出ている Two-sided fairness in rankings via Lorenz dominance 要旨 レコメンドにおいてItemに対するpreferenceが与えられた状況で、 User側のutilityの和と、ItemのGini係数(の拡張 ; GGFs)の和が 最良になる fair なランキングの手法を提案。 前年の論文で、微分可能な関数による手法を提案していた。 今回の論文で、微分不可能な Gini係数を、微分可能な関数の手法に 帰着させることで解決を図る、という筋書。 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 3

Slide 4

Slide 4 text

前提 User に Item を確率的にレコメンド ... User が Item にもつ価値 ... User に対して Item が 番目にお薦めされる確率 ... User が 番目にお薦めの Item に接触する確率 (単調減少) User の utility : 価値の高いアイテムほど上位に出ていればutility大きい Item の exposure : アイテムが上位にレコメンドされる頻度が多いほどexposure大きい を Fix した状態で を動かし、 utility / exposure を増やすようにする問題と考える。 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 4

Slide 5

Slide 5 text

Lorenz efficiency Generalized Lorenz Curve utility を低いほうから累積和をとったもの(図はNeurIPS2021) 下に突き出ているほど不平等 青 : user utility の総和 max → itemが不平等 赤 : user も item もまだ上に持っていける余地がある。 Lorenz efficiency user/item いずれも curve を上側に改善できない状態 論文著者にとっての fairness の定義 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 5

Slide 6

Slide 6 text

Lorenz efficiency を見つける 増加とともに効果が低減するような関数 の 次の線形和を最大にする は、Lorenz efficiency を満たす! は事前に決めたパラメータ IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 6

Slide 7

Slide 7 text

Frank-Wolf アルゴリズムの適用 は確率行列(tensor)なので、 で和をとると1になる制約を満たす必要がある。 この場合、凸集合での微分可能な関数を最適化する手法である Frank-Wolfアルゴリズム が使える Step 1: Step 2 : Step 3 : Step1 の argmax の見つけ方 微分 を計算 の User ごとの降順ソートに対応する 置換行列 が argmax を満たしている! 置換行列が確率行列(tensor)であることに注意。 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 7

Slide 8

Slide 8 text

GGFs 同じ手続きを item exposure の Gini 係数最小化に使えないか? これが SIGIR2022 論文の目標! Generalized Gini welfare Functions (GGFs) 非増加の重み列 をパラメータとする関数 次元の入力 について 昇順ソート を使って次のように定義される。 特に item exposure に対する gini 係数は、 GGFsを使った次の値を最大化することと(ほぼ)等価 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 8

Slide 9

Slide 9 text

GGFs と Lorenz efficiency 例えば次の関数を最大にするレコメンド は、 user utility / item gini 係数のバランスをとることができる。 GGFs の線形和の形となっている ( はパラメータ) 実は GGFs の線形和の形の関数を最大にするレコメンド は、 Lorenz efficiency を満たしている では、そのような をさっきと同じように微分で求めよう! 残念! GGFs は単純に微分できない (昇順ソートがあるから) IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 9

Slide 10

Slide 10 text

GGFsの最適化 骨子 : Step1/2 の繰り返し (上下幅を縮めながら) Step1. 微分可能な関数で上下を挟み、挟んだ関数上で微分 Step2. 微分をつかって Frank-Wolf で を Update 上下を挟むなめらかな関数 (モーロー包 ; Moreau envelope) 微分不可能な関数 に対して 次の は比較的簡単な手続きで微分できる。 計算できた部分 を使って、GGFsの線形和全体の微分を算出 これをソートして、更新して... IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 10

Slide 11

Slide 11 text

数値実験 : 条件 対象データ : Lastfm-2k, MovieLens-20m を対象 user-item preference は行列分解から算出 ランクごとの接触重みは DCG を利用 比較手法 FairRec(*) : Userが順に1つずつとる(先取り)ドラフト会議方式 微分可能な関数による方法 welf : NeurIPS(2021)で提案された減衰関数 を使う。 eq. exposure (stf) : item exposure の分散を使う (Giniっぽい) GGF : 提案法 GGFについては、utility が小さい user に重みを付ける two-side fairness を考慮した計算も実施。 (*) Patro+(2020), FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms (WWW2020, arxiv/2002.10764) IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 11

Slide 12

Slide 12 text

数値実験結果 : Lastfm-2k 左 : user については utility の合計を max にする場合 右 : user については utility の小さい 25% に重みを付ける場合 いずれも user/item のバランス を変化させた結果をプロット GGF の パレート曲線 がいずれも左上に来ている (最適手法) IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 12

Slide 13

Slide 13 text

まとめ user/item 両方の Lorenz 曲線が改善できない = fairである これを Lorenz efficiency という GGFs を使った user/item の fairness を考慮したランキングを提案 GGFs の和を最大にするランキングは Lorentz efficiency を満たす 本来微分不可能な関数である GGFs を、微分可能な関数で近似できる 近似した関数での微分を使って、Frank-Wolfで最適化できる GGFs を使ったランキングは従来手法より、 user utility /item exposure を改善 IR Reading 2022 秋 / Optimizing generalized Gini indices for fairness in rankings 13