[Journal Club]A Unified Approach to Interpreting Model Predictions

A Unified Approach to Interpreting Model Predictions Scott Lundberg, Su-In
Lee (Paul G. Allen School of Computer Science University) NeurIPS 2017 慶應義塾大学杉浦孔明研究室飯岡雄偉

概要 : SHAP (SHapley Additive exPlanations) ◼ モデルの説明可能性・解釈性を向上  局所的な線形モデルへ
◼ Shapley値によってモデルの性能に対する貢献度を求める ◼ モデルの構造にかかわらず実装が可能 ◼ 人間の評価に近い性能を実現 2

背景 : 性能と説明可能性のトレードオフ ◼ 昨今の学習モデルは性能向上のために複雑化 ➢ どの特徴量が性能に寄与したのかをユーザが理解できない ➢ 「AI利活用原則案(総務省, 2018)」にも説明可能性への留意が言及されている
信用できないなぁあなたは◦◦病ですなんとなくそんな気がします 3

既存研究 : 説明可能性が不十分 4 ◼ LIME [Rebeiro+ 16]  複雑なモデルを局所的に線形モデルへ
変換  機械表現で学習したモデルを，可読表現で説明  各特徴量が独立しているとみなすために不十分 ◼ DeepLIFT[Shrinkumar+ 17]  深層学習モデルの説明に使用  入力を微小に変化させたときの出力の変化によって注目度を決定  勾配の代わりに基準点からの差分を用いる変化後”猫”と認識しなくなる ⇒正しい判断根拠がない

提案手法 : SHAP (SHapley Additive exPlanations) 5 ◼ LIMEと同様に機械表現での学習モデルを可読表現で説明する 
説明モデルは局所的な線形モデル ◼ 入力された各特徴量は独立ではないことが多い ⚫ e.g. 蒙古タンメンが人気の理由はなにか. ⇒ 辛さ？おいしさ？⇒この２つには関係性がある ➢ それぞれの順番と組み合わせを考慮したShapley値を貢献度として利用

Shapley値の求め方 6 ◼ 3人での仕事と報酬を考える ⇒ 3人で働くと24万円もらえる ➢ 平等な分け方は，個人の能力を評価して3:2:1？ • 人によって相性があるはず
➢ Aが参加するとどれだけの変化があるのか求める（限界貢献度) 参加者報酬 A 6 B 4 C 2 A+B 20 B+C 10 C+A 15 A+B+C 24 ∅ ⇒ A 6 B ⇒ B+A 16 C ⇒ C+A 13 B+C ⇒ A+B+C 14

Shapley値の求め方 7 ◼ 参加順の効果を打ち消すためにそれぞれで平均値をとる  A : (6+6+16+14+13+14) / 6
= 11.5万円  BとCでも同様に計算するとそれぞれ8万円と4.5万円 ∅ ⇒ A 6 B ⇒ B+A 16 C ⇒ C+A 13 B+C ⇒ A+B+C 14 参加順 Aの限界貢献度 Bの限界貢献度 Cの限界貢献度 A -> B -> C 6 14 4 A -> C -> B 6 9 9 B -> A -> C 16 4 4 B -> C -> A 14 4 6 C -> A -> B 13 9 2 C -> B -> A 14 8 2

3つの要請 : SHAPの原理 8 ① 説明対象モデル𝑓と説明モデル𝑔(線形)の値は等しい • 入力𝑥をバイナリデータである𝑥′にマッピングし，可読表現へ ➢ 言語や画像の𝑖番目の要素が存在するか否か
• 可読特徴に対する重要度を𝜙𝑖 で表す ➢ SHAPではこの𝜙𝑖 がshapley値となる ② 存在しない説明要因の貢献度をゼロにする

3つの要請 : SHAPの原理 9 ③ 異なるモデル𝑓と𝑓′において，可読特徴𝑧𝑖 ′の有無による値の変化量が大きいモデルのほうが𝑧𝑖 ′の貢献度は大きくなる 𝑧𝑖
′ = 0 •𝑧′は可読特徴𝑥′における非ゼロ成分の部分集合

➢ Shapley値に𝜙𝑖 が一致する ⇒ 貢献度を表現 • 分母は並べ方の総数，分子は𝑧𝑖 ′以外の並べ方を示す ➢ 説明モデルから対象モデルの写像と，莫大な計算量が問題点
SHAPの主定理 10

➢ 𝑓𝑥 (𝑧′)では，説明モデルでの変数𝑧′のゼロ要素が対象モデルで意味を持つ可能性がある • e.g. 画像特徴量であれば0は意味を持ってしまう ➢ よって，非ゼロの要素𝑧𝑆 を条件に持つ期待値を求めるようにする •
ゼロ要素はランダムなデータ分布に従って値が割り振られる SHAPの主定理 : 問題点への対処 11

➢ 莫大な計算量を避けるため，shapley値を近似する  モデルに依存しない : Kernel SHAP  モデルに依存する :
Linear SHAP (各特徴量は独立しているととらえる) • Linear SHAP : 線形モデルに対して近似 ⇒ SHAPの主定理 : 問題点への対処 12 この関数がshapley値の近似を表す（証明は省略） https://drive.google.com/file/d/1GGOPytSR2ZeX8Yl0epVZoYTsAePuA5VP/view?usp=sharing

定量的結果 : 被験者実験において人間に近い結果 13 ◼ A : 診断の判断要因の説明性 ➢ LIMEと異なり，要因を独立させずに判断ができている
◼ B : 問題の正解数による利益の分配 • 1が5問正解，2が4問正解，3は全問不正解 • $5を分配する ➢ 人間に近い分け方を提示

定性的結果 : 既存手法と比較して良好な性能 14 ◼ MNISTによる実験 • 数字の予測の際にpositiveな要因を赤く， negativeな要因を青く表示 •
New DeepLiftはDeepLIFTにおける勾配に shapley値を利用 ➢ SHAPの考えを用いた2手法において，よりはっきりと要因を理解している

動作確認 : ボストンにおける住宅価格要因 15 要因名要因の詳細 CRIM 人口 1 人当たりの犯罪発生数
ZN 25,000 平方フィート以上の住居区画の占める割合 INDUS 小売業以外の商業が占める面積の割合 CHAS チャールズ川によるダミー変数 (1: 川の周辺, 0: それ以外) NOX NOx の濃度 RM 住居の平均部屋数 AGE 1940 年より前に建てられた物件の割合 DIS 5 つのボストン市の雇用施設からの距離 (重み付け済) RAD 環状高速道路へのアクセスしやすさ TAX $10,000 ドルあたりの不動産税率の総計 PTRATIO 町毎の児童と教師の比率 LSTAT 給与の低い職業に従事する人口の割合 (%)

まとめ 16 ◼ モデルの説明可能性・解釈性を向上  局所的な線形モデルへ ◼ Shapley値によってモデルの性能に対する貢献度を求める ◼ モデルの構造にかかわらず実装が可能
◼ 人間の評価に近い性能を実現

[Journal Club]A Unified Approach to Interpretin...

[Journal Club]A Unified Approach to Interpreting Model Predictions

Semantic Machine Intelligence Lab., Keio Univ. PRO

More Decks by Semantic Machine Intelligence Lab., Keio Univ.

Other Decks in Technology

Featured

Transcript

A Unified Approach to Interpreting Model Predictions Scott Lundberg, Su-In

概要 : SHAP (SHapley Additive exPlanations) ◼ モデルの説明可能性・解釈性を向上  局所的な線形モデルへ

既存研究 : 説明可能性が不十分 4 ◼ LIME [Rebeiro+ 16]  複雑なモデルを局所的に線形モデルへ

提案手法 : SHAP (SHapley Additive exPlanations) 5 ◼ LIMEと同様に機械表現での学習モデルを可読表現で説明する 

Shapley値の求め方 6 ◼ 3人での仕事と報酬を考える ⇒ 3人で働くと24万円もらえる ➢ 平等な分け方は，個人の能力を評価して3:2:1？ • 人によって相性があるはず

Shapley値の求め方 7 ◼ 参加順の効果を打ち消すためにそれぞれで平均値をとる  A : (6+6+16+14+13+14) / 6

3つの要請 : SHAPの原理 8 ① 説明対象モデル𝑓と説明モデル𝑔(線形)の値は等しい • 入力𝑥をバイナリデータである𝑥′にマッピングし，可読表現へ ➢ 言語や画像の𝑖番目の要素が存在するか否か

3つの要請 : SHAPの原理 9 ③ 異なるモデル𝑓と𝑓′において，可読特徴𝑧𝑖 ′の有無による値の変化量が大きいモデルのほうが𝑧𝑖 ′の貢献度は大きくなる 𝑧𝑖

➢ Shapley値に𝜙𝑖 が一致する ⇒ 貢献度を表現 • 分母は並べ方の総数，分子は𝑧𝑖 ′以外の並べ方を示す ➢ 説明モデルから対象モデルの写像と，莫大な計算量が問題点

➢ 莫大な計算量を避けるため，shapley値を近似する  モデルに依存しない : Kernel SHAP  モデルに依存する :

定量的結果 : 被験者実験において人間に近い結果 13 ◼ A : 診断の判断要因の説明性 ➢ LIMEと異なり，要因を独立させずに判断ができている

定性的結果 : 既存手法と比較して良好な性能 14 ◼ MNISTによる実験 • 数字の予測の際にpositiveな要因を赤く， negativeな要因を青く表示 •

動作確認 : ボストンにおける住宅価格要因 15 要因名要因の詳細 CRIM 人口 1 人当たりの犯罪発生数

まとめ 16 ◼ モデルの説明可能性・解釈性を向上  局所的な線形モデルへ ◼ Shapley値によってモデルの性能に対する貢献度を求める ◼ モデルの構造にかかわらず実装が可能