DEIM2022チュートリアル「説明可能な機械学習入門～Feature Attribution法～」

説明可能な機械学習⼊⾨〜 Feature Attribution法〜千葉⼯業⼤学⼈⼯知能・ソフトウェア技術研究センター吉川友也 DEIM2022
チュートリアル https://github.com/yuyay/DEIM2022_XAI_tutorial スライド、コードはこちらからダウンロードできます

⾃⼰紹介 • 研究トピック − 機械学習（説明可能AI、深層学習、カーネル法、ベイズモデル等） − コンピュータビジョン（動作認識、OCR等） 2 • 吉川
友也 • 千葉⼯業⼤学⼈⼯知能・ソフトウェア技術研究センター主任研究員 • 博⼠（⼯学） − 2015年奈良先端科学技術⼤学院⼤学

本チュートリアルの内容 • ⽬標 − LIME・SHAPについての基礎と実装⽅法を理解する • 内容の難易度 − 学部4年⽣レベル（？） •
想定する前提知識 − 線形回帰 − ニューラルネット (NN) 3

アジェンダ 1. 背景 − XAIが研究されている理由 − XAIがどんな場⾯で役⽴つのか？ 2. Feature Attribution法⼊⾨
− LIME, SHAPについて紹介 3. Pythonによる実装の紹介【録画】 4. 最近のFeature Attribution法に関する研究 5. Q&A 4

背景 5

背景機械学習（特にNN）の進歩 • 2012年頃から、画像・⾳声・⾔語等様々な分野でニューラルネットが台頭 • 様々な場⾯で実⽤化されている (or されつつある) 6
https://paperswithcode.com/sota/image-classification-on-imagenet ImageNetの認識精度顔認証 https://jpn.nec.com/biometrics/face/about.html ⾃動運転機械翻訳⾳声合成 https://gigazine.net/news/ 20170125-tesla-fully-self-driving-car/

背景ブラックボックスな機械学習⾼精度の機械学習法ほど複雑な構造となり内部の処理を⼈間が理解することは困難 7 VGGNet 16層 1億3千万パラメータ簡単そうなのになぜ間違えた？
どこを⾒て判断している？ガンです⽝ですなぜ予測が当たる/外れるのか⼈間が理解できない

背景 AI（機械学習）の透明性についての社会のニーズ • より責任が伴う場でのAIの利⽤が進んでいる − 医療、⾃動運転等の誤動作を避けなければいけない場⾯ − 与信審査等の公平性・信頼性が求められる場⾯ 8 •
AIが社会に受け⼊れられ適正に利⽤されるために、世界でガイドライン作りが⾏われている − ⽇本: ⼈間中⼼のAI社会原則 “公平性及び透明性のある意思決定とその結果に対する説明責任が適切に確保” − OECD: OECD Principles on AI “AIシステムについて、(中略)、透明性を確保し責任ある情報開⽰を⾏うべきである” • ⼀⽅で、AIに対する不信感、恐怖感の声もある

AIの透明性を改善する上での課題 “精度”と“解釈性”のトレードオフ 9 精度解釈性の良さニューラルネットランダムフォレスト SVM 𝑘近傍法決定⽊
線形回帰分類ルール年齢<20 Yes No

年齢<20 Yes No AIの透明性を改善する上での課題 “精度”と“解釈性”のトレードオフ 10 精度解釈性の良さニューラルネットランダムフォレスト
SVM 𝑘近傍法決定⽊線形回帰分類ルール (eXplainable AI) XAI

XAI⼿法の分類 11 図は[恵⽊ 2020]より引⽤ [恵⽊ 2020] 因⼦型説明 “Aさんの職業が〇〇だから” 事例型説明 Aさんと似た状況で返済難に
なった事例を⽰す知識型説明 “AIはAさんの会社の信⽤度が低いと判断した” 反実型説明 “もし年収が〇〇円以上であれば通っていた”

XAI⼿法の分類 12 図は[恵⽊ 2020]より引⽤因⼦型説明 “Aさんの職業が〇〇だから” 事例型説明 Aさんと似た状況で返済難になった事例を⽰す知識型説明
“AIはAさんの会社の信⽤度が低いと判断した” 反実型説明 “もし年収が〇〇円以上であれば通っていた” [恵⽊ 2020] Feature Attribution法

Feature Attribution法予測結果を特徴量の貢献度で説明する⼿法 • 代表的な⼿法が LIME と SHAP − 特徴量の貢献度を⾜し合わせると予測値になる
13 ⾝⻑体重出⾝ 172 63 東京表形式データの場合性別男性特徴量予測説明貢献度⾝⻑体重出⾝ Feature Attribution法 (w/ 予測モデル) Feature Attribution法

特徴量の貢献が説明できるメリット予測に効く・効かない特徴量を調べられる • 特徴量が予測にどう効いているのかを⾒れば、モデルの傾向を理解することが可能 − さらに性能を上げるための特徴量エンジニアリングの補助になる 14 特徴量A 特徴量B 特徴量C
特徴量の値貢献特徴量AとBは期待通り予測に効いているみたいだでも、特徴量Cはどんな値でも予測に効いてないな前処理が悪いのかも？

特徴量の貢献が説明できるメリット AIよる予測結果をユーザが受け⼊れる判断材料になる • 重要な意思決定が必要な場⾯では、最終的に⼈間がAIの予測結果の妥当性を判断することが必要 • 予測の根拠として特徴量の貢献を提⽰することで、⼈間の意思決定の補助が可能 15 画像は https://www.fujifilm.com/jp/ja/news/list/6823
から引⽤確かにこの部分は肺がんが疑われるな例: 医療画像診断におけるAI モデルの予測: 肺がん

特徴量の貢献が説明できるメリットモデルが公平な予測を⾏っているか知ることができる • 訓練データ中の特徴量の偏りのせいで、モデルは不公平な予測をする可能性がある • 特徴量の貢献を知ることで、モデルの不公平さに早く気が付き、訓練データを修正するなどの対策が取れる 16 訓練データが偏っていた
男性⼥性その他 “性別”に影響を受けすぎてない？調べてみたら性別=男性貢献 … … 問題: 猫好きか否か

Feature Attribution法⼊⾨ ~ LIME & SHAP ~ 17

Feature Attribution法の代表例1 Local Interpretable Model-agnostic Explanations (LIME) • ブラックボックスな予測モデルの出⼒を線形回帰モデルで近似することで各特徴量が予測値に対してどう貢献するかを説明する⼿法
18 [Ribeiro+ 2016] ブラックボックス予測モデル⼊⼒出⼒ LIME ラベル確率 Dog 0.64 Cat 0.33 ⁝ ⁝ 説明 𝑔 𝒙′ = 𝑤"𝑥′" + ⋯ + 𝑤#𝑥′# 線形回帰モデルでFit

LIMEによる説明の例 19 図は https://github.com/marcotcr/lime から引⽤テキスト分類表形式データに対する分類画像分類

LIME利⽤の流れ • テスト事例 𝒙 ∈ ℝ! の近傍 𝒛 ∈ ℝ!
を⽤いて、予測モデルの出⼒ 𝑓 𝒙 を近似する線形回帰モデル 𝑔: ℝ! → ℝ を学習 20 𝑔 𝒙 = 𝑤"𝑥" + ⋯ + 𝑤#𝑥# • ユーザは、線形回帰モデル 𝑔 の係数（重み）𝒘 ∈ ℝ! を⾒て、出⼒ 𝑓 𝒙 に対する各特徴量の貢献度を理解する • 予測モデル 𝑓: ℝ! → ℝ を学習 1. 予測モデルを⽤意 2. LIMEの学習 3. LIMEによる説明を解釈そこを⾒て判断しているのか〜 𝒘 ∈ ℝ!: 係数パラメータ

LIMEにおける説明モデルの直感的なイメージ⻘クラスと⾚クラスの⼆値分類の場合 21 説明したいテスト事例 𝒙 説明で使う局所線形モデル 𝑔 ⋅
図は[Ribeiro+ 2016] Fig. 3から引⽤⼊⼒空間 ℝ"

「リッチな⼊⼒」と「解釈しやすい⼊⼒」の利⽤ • 何を⾒て予測モデルが判断しているのか明らかにするために、元々の⼊⼒に加えて、解釈しやすい表現（解釈表現）を説明のために利⽤ 22 For Christmas Song visit my
channel ! ;) 元表現 𝒙：単語の系列解釈表現 𝒙′：bag-of-wordsベクトル元表現 𝒙：RGBピクセル値解釈表現 𝒙′：Superpixelのマスクベクトルテキスト画像 ℝ!×#×$ 0 1 1 1 … 1 0 1 For Christmas Song visit my channel ! ;) 0 1 1 1 … 1 0 1 {0,1}% {0,1}% LIMEの説明モデルでは解釈表現を⼊⼒とする: 𝑔 𝒙′ = 𝑤# 𝑥# + ⋯ + 𝑤! 𝑥!

LIMEの説明モデルの学習＝重み付き最⼩⼆乗法を解く • テスト事例の解釈表現 𝒙′ の近傍集合 𝒩𝒙% からランダムに疑似解釈表現 𝒛′ を⽣成し、それに対する予測モデルの
出⼒ 𝑓(ℎ(𝒛%)) を近似するように線形回帰の係数 𝒘 を最適化 − その際、𝒛%は 𝒙%との類似度（カーネル）に応じて重み付け 23 𝒘∗ = argmin𝒘 ; 𝒛"~𝒩𝒙" 𝜋(𝒙′, 𝒛′) 𝑓 ℎ(𝒛%) − 𝒘+𝒛′ " + 𝜆Ω(𝒘) 𝜋 𝒙′, 𝒛′ = exp(− ℎ(𝒙%) − ℎ(𝒛′) " "/𝜎") ℎ(𝒛'): 解釈表現 𝒛%から元表現を復元する関数 𝒩𝒙' : 𝒙% の近傍集合 Ω(𝒘) = 𝒘 " " (正則化項)

LIMEの実装 • 近傍事例の作り⽅がデータの種類によって異なる − 表形式データ − テキストデータ − 画像データ •
LIME著者がどのような実装をしているかを紹介 24

表形式データに対するLIME • 表形式データ − 数値特徴とカテゴリカル特徴が混在 − 1⾏が1事例に対応 25 ⾝⻑体重
出⾝職業 172 63 東京学⽣ 161 50 神奈川会社員 ⁝ ⁝ ⁝ ⁝ 159 49 静岡公務員数値特徴カテゴリカル特徴性別男性⼥性 ⁝ ⼥性ラベル

表形式データに対するLIME：数値特徴の近傍事例の作り⽅ 26 • 訓練データを⽤いて数値特徴の値を量⼦化（量⼦化の⽅法は選択可能） • どのビンを選ぶかをランダムに決定。⼊⼒と同じだったら1、違えば0 • 選ばれたビンに対応する分布から値をサンプリング⾝⻑ 100
200 1 2 3 4 例：四分位量⼦化ランダムにビンを決定し、そのビンにおける平均・標準偏差・最⼩・最⼤を⽤いて切断正規分布から近傍の特徴量の値を⽣成 140 165 175 167.2 前処理疑似解釈表現 𝒛′ 疑似元表現 ℎ(𝒛%) 訓練データを⽤いて各特徴量の四分位数を求める準備⽣成

表形式データに対するLIME：カテゴリカル特徴の近傍事例の作り⽅ 27 • 訓練データから特徴の頻度割合を計算 • その割合に基づいて、ランダムに特徴を⽣成 • 対応する解釈可能な⼊⼒では、元の⼊⼒と⽣成された特徴が同じなら1、そうでなければ0の⼆値で表現出⾝
北海道 … 東京 … 沖縄割合 0.03 … 0.12 … 0.01 出⾝東京東京 1. 特徴の割合を計算 2. 特徴を⽣成 3. ⼊⼒と⽐較東京⼊⼒における特徴値⽣成された特徴値前処理疑似解釈表現 𝒛′ 疑似元表現 ℎ(𝒛%)

テキストデータに対するLIME • テスト事例に対して、ランダムに単語をマスクして疑似元表現を⽣成 − マスクされた単語は [MASK] のような特別な単語に置き換え • 疑似解釈表現では、マスクするところを0、それ以外を1とする⼆値ベクトル 28
テスト事例の元表現 𝒙 For Christmas Song visit my channel ! ;) 疑似元表現 𝑧 疑似解釈表現 𝑧′ [MASK] Christmas [MASK] visit my [MASK] ! ;) [ 0 1 0 1 1 0 1 1 ] 近傍事例をランダム⽣成

画像データに対するLIME 画像のセグメンテーションを利⽤ 1. Superpixelアルゴリズムを⽤いて、画像のセグメンテーションを求める 2. 各領域をマスクするかどうかを0/1 で表現したものを擬似解釈表現 𝒛′とし、ランダムに⽣成する
3. 擬似解釈表現 𝒛′に従ってマスクした画像を擬似元表現 ℎ(𝒛%)とする 29 𝑑 = 100個の領域画像は https://scikit- image.org/docs/0.11.x/auto_examples/plot_se gmentations.html から引⽤セグメンテーション近傍事例構築の⼿順ランダムに⽣成 0 1 1 … 1 0 1 𝒛′ ∈ {0,1}% 各領域をマスクするかどうかを表すベクトルマスクした画像 ℎ(𝒛!) テスト事例 (マスクする場合が0)

LIMEの説明モデルの学習＝重み付き最⼩⼆乗法を解く • テスト事例の解釈表現 𝒙′ の近傍集合 𝒩𝒙% からランダムに疑似解釈表現 𝒛′ を⽣成し、それに対する予測モデルの
出⼒ 𝑓(ℎ(𝒛%)) を近似するように線形回帰の係数 𝒘 を最適化 − その際、𝒛%は 𝒙%との類似度（カーネル）に応じて重み付け 30 𝒘∗ = argmin𝒘 ; 𝒛"~𝒩𝒙" 𝜋(𝒙′, 𝒛′) 𝑓 ℎ(𝒛%) − 𝒘+𝒛′ " + 𝜆Ω(𝒘) 𝜋 𝒙′, 𝒛′ = exp(− ℎ(𝒙%) − ℎ(𝒛′) " "/𝜎") ℎ(𝒛'): 解釈表現 𝒛%から元表現を復元する関数 𝒩𝒙' : 𝒙% の近傍集合 Ω(𝒘) = 𝒘 " " (正則化項)

Feature Attribution法の代表例2： SHapley Additive exPlanations (SHAP) • 機械学習法（ブラックボックス）の予測値に対する各特徴量の貢献を Shapley値の近似（SHAP値）を⽤いて説明する⼿法 31
Lloyd Shapley (1923~2016) 経済学者・数学者 2012年ノーベル経済学賞 [Lundberg+ 2017] https://github.com/slundberg/shap “Lloyd Shapley in Stockholm 2012” by Bengt Nyman

SHAP理解のための準備：協⼒ゲーム理論 • 例：3名のプレイヤー(A, B, C)によるアルバイト − プレイヤーの組み合わせ⽅で報酬が変わる − 報酬（=24）をプレイヤーにどのように分配するのがよいか？ 32
Aさん Bさん Cさんいくらもらえる？ [岡⽥ 2011] 表は[森下 2021]より引⽤

貢献度に応じて報酬をプレイヤーに分配する⽅法 1/2 • 貢献度を測るためにプレイヤーの限界貢献度を導⼊ − 限界貢献度：プレイヤーがアルバイトに参加したとき、参加しなかった場合と⽐べて、報酬がいくら増えるか 33 例：Aさんの限界貢献度計算 −
誰がすでに参加しているかで変化前提条件現在の状況限界貢献度参加なし Aのみ参加 6 − 0 = 6 Bのみ参加 A・Bが参加 20 − 4 = 16 Cのみ参加 A・Cが参加 15 − 2 = 13 B・Cが参加 A・B・Cが参加 24 − 10 = 14 表は[森下 2021]より引⽤

貢献度に応じて報酬をプレイヤーに分配する⽅法 2/2 • アルバイトに参加する順番の影響を排除するために、全てのプレイヤーの参加順の組み合わせで限界貢献度の平均を計算 • この平均の限界貢献度をShapley値と呼ぶ 34 平均 11.5
平均 8 平均 4.5 各プレイヤーの Shapley値表は[森下 2021]より引⽤

Shapley値の数式表現 • 𝐽 : 全プレイヤーの集合 |𝐽| : 全プレイヤーの数 • 𝑆
⊆ 𝐽 ∖ 𝑗 : 𝐽 からプレイヤー 𝑗 を除いた集合に対する任意の部分集合 • 𝑣 ⋅ → ℝ : 報酬関数 − 𝑣 𝑆 ∪ 𝑗 : プレイヤー集合 𝑆 にプレイヤー 𝑗 を追加したときの報酬 − 𝑣 𝑆 : プレイヤー集合 𝑆 に対する報酬 35 𝜙, = 1 𝐽 ! ; -⊆/∖{,} 𝑆 ! 𝐽 − 𝑆 − 1 ! (𝑣 𝑆 ∪ 𝑗 − 𝑣 𝑆 ) = 𝔼-⊆/∖{,} 𝑣 𝑆 ∪ 𝑗 − 𝑣 𝑆 𝑗 番⽬のプレイヤーのShapley値 𝜙, 組み合わせの出現回数 𝑆 にプレイヤー 𝑗 が参加したときの限界貢献度

SHAPにおけるShapley値＝特徴量を追加したときの予測値に対する平均限界貢献度予測モデルの出⼒ 𝑓 𝒛- の計算 36 アルバイトゲーム ⇔
SHAP プレイヤー ⇔ 特徴量報酬 𝑣(𝑆) 𝑆: プレイヤー集合 ⇔ アルバイトゲームとSHAPの概念の対応関係 𝑓 𝒛- = 𝔼𝒛$ % |𝒛% [𝑓(𝒛)] ≈ 𝔼𝒛$ % [𝑓(𝒛)] 観測されていない特徴量集合 (= ̅ 𝑆 )について値が決まらないので期待値を求める特徴量間の独⽴性を仮定予測モデルの出⼒ 𝑓 𝒛& 𝒛& = ℎ 𝒛& ' : 特徴量集合𝑆についてのみ観測された元表現

SHAPにおけるShapley値の性質 37 説明モデル𝑔 𝒙% は予測モデル𝑓(𝒙)と⼀致性質1. 局所的な精度 𝑓 𝒙 =
𝑔 𝒙% = 𝔼𝒙 𝑓(𝒙) + ; ,∈/ 𝑤, 𝑥′, ある解釈表現 𝑥, % が0のとき、対応するShapley値も0 性質2. ⽋損性 𝑥, % = 0 ⟹ 𝑤, = 0 予測モデルが変わり、特徴量の貢献度が変われば、Shapley値も同様に変わる性質3. ⼀貫性 𝑓% 𝑧 − 𝑓% 𝑧∖, % ≥ 𝑓 𝑧 − 𝑓 𝑧∖, % ２つの予測モデル𝑓, 𝑓′に対してならば、各々に対するShapley値 𝒘, 𝒘&は 𝑤′, ≥ 𝑤,

⼤きすぎるShapley値の計算量に対するSHAPの⼯夫 • 単純にやると、𝒪(𝟐|𝑱|) 回予測モデルの出⼒を求める必要がある − 特徴量の数 𝐽 = 100 なら、≈
1067 回！ • 計算量を減らすための近似法 − 予測モデル⾮依存、サンプリングによる近似（KernelSHAP） − ⽊構造ベース予測モデルに特化した近似（TreeSHAP） − ニューラルネットベース予測モデルに特化した近似（DeepSHAP） 38 𝜙, = 1 𝐽 ! ; -⊆/∖{,} 𝑆 ! 𝐽 − 𝑆 − 1 ! (𝐸[𝑓 ℎ(𝒛′) |𝒛-∪ , % ] − 𝐸[𝑓 ℎ(𝒛′) |𝒛- % ]) 特徴量 𝑗 のShapley値

KernelSHAP Shapleyカーネルを⽤いた重み付き最⼩⼆乗法によるSHAP値の推定 • 実は、カーネル 𝜋 𝒙%, 𝒛% としてShapleyカーネルを⽤いれば、 LIMEと同様に重み付き最⼩⼆乗法でSHAP値を求めることが可能 39
𝜋 𝒙', 𝒛' = (|𝐽| − 1) 𝐶 𝐽 , 𝒛' 𝒛' 𝐽 − 𝒛' SHAP値 𝒘 の推定 𝒘∗ = argmin𝒘 < 𝒛)~𝒩 𝒙) 𝜋 𝒙', 𝒛' 𝑓 ℎ(𝒛') − 𝒘;𝒛′ < ただし、𝜋 𝒙', 𝒛' はShapleyカーネル： 𝐶 𝐽 , 𝐳' : 𝐽 から 𝐳' 取る組み合わせの数 ℎ(𝒛') : 解釈表現 𝒛′ から対応する元表現 𝒛 への変換

KernelSHAP Shapleyカーネルを⽤いた重み付き最⼩⼆乗法によるSHAP値の推定 • 実は、カーネル 𝜋 𝒙%, 𝒛% としてShapleyカーネルを⽤いれば、 LIMEと同様に重み付き最⼩⼆乗法でSHAP値を求めることが可能 40
𝜋 𝒙', 𝒛' = (|𝐽| − 1) 𝐶 𝐽 , 𝒛' 𝒛' 𝐽 − 𝒛' SHAP値 𝒘 の推定 𝒘∗ = argmin𝒘 < 𝒛)~𝒩 𝒙) 𝜋 𝒙', 𝒛' 𝑓 ℎ(𝒛') − 𝒘;𝒛′ < ただし、𝜋 𝒙', 𝒛' はShapleyカーネル： 𝐶 𝐽 , 𝐳' : 𝐽 から 𝐳' 取る組み合わせの数 ℎ(𝒛') : 解釈表現 𝒛′ から対応する元表現 𝒛 への変換

Shapleyカーネルの妥当性 41 [Lundberg+ 2017]のSupplimental Materialを読んでください！時間がないので…

表形式データに対する疑似事例の⽣成 • LIMEとは異なり、𝑧, % = 0のときは訓練データ中の特徴量 𝒋 の値から⼀つ選ぶ 42 ⾝⻑
体重出⾝ 172 63 東京⾝⻑体重出⾝ 1 1 1 ⾝⻑体重出⾝ 1 0 0 ⾝⻑体重出⾝ 172 59 神奈川テスト事例の元表現 𝒙 = ℎ(𝒙&) テスト事例の解釈表現 𝒙′ 疑似事例の解釈表現 𝒛′ 疑似事例の元表現 𝒛 = ℎ(𝒛&) ランダムに0/1を割り当て訓練データからランダムに値を割り当て

少ない疑似事例でSHAP値を求める⼯夫 • 解釈表現 𝒛%がほとんど0 or 1から成るときにカーネル 𝝅 𝒙%, 𝒛%
が⼤きな値 − これらが係数（SHAP値） 𝒘 の学習への影響⼤ − そのような特徴の組み合わせを優先的に使うことでSHAP値の計算式を近似 43 [Lundberg+ 2017]のFig. 2から引⽤ 𝜋 𝒙', 𝒛' の分布⼤⼤⼩ SHAP値の計算式： 𝒘∗ = argmin𝒘 < 𝒛)~𝒩 𝒙) 𝜋 𝒙', 𝒛' 𝑓 ℎ(𝒛') − 𝒘;𝒛′ <

𝐾 個の疑似事例を⽤いる場合のサンプリング法 1. 𝑚 = 1 とする 2. 𝑚個の特徴と 𝐽
− 𝑚個の特徴で1 or 0になる疑似解釈事例 𝒛%を全て⽣成 3. ここまで⽣成した疑似事例の数が𝐾未満なら、𝑚 = 𝑚 + 1 して2に戻る 4. カーネル 𝜋(𝒙%, 𝒛%) を再計算 44 1 0 0 … 0 0 0 0 0 0 … 0 0 1 0 1 1 … 1 1 1 1 1 1 … 1 1 0 1 1 0 … 0 0 0 0 0 0 … 0 1 1 0 0 1 … 1 1 1 1 1 1 … 1 0 0 … … … … 𝑚 = 1のとき → 2×|𝐽|個 𝑚 = 2のとき → 2×𝐶( 𝐽 , 2)個⽣成される疑似事例の解釈表現 𝒛'

LIMEとSHAPのまとめ • LIME：予測モデルの出⼒を線形回帰モデルの係数で説明 • SHAP：Shapley値に基づいて、予測モデルにおける特徴量の貢献度を説明 • LIMEと(Kernel)SHAPは、重み付き最⼩⼆乗法で解くことが可能 − ただし、カーネル関数と正則化項が異なる 45
𝜋 𝒙', 𝒛' = (|𝐽| − 1) 𝐶 𝐽 , 𝒛' 𝒛' 𝐽 − 𝒛' 𝜋 𝒙′, 𝒛' = exp(− ℎ(𝒙') − ℎ(𝒛') ( (/𝜎() 𝒘∗ = argmin𝒘 D 𝒛!~𝒩 𝒙! 𝜋 𝒙', 𝒛' 𝑓 ℎ(𝒛') − 𝒘.𝒛′ ( + 𝜆Ω(𝒘) ⽬的: Ω 𝒘 = 𝒘 ( ( Ω 𝒘 = 0 LIME (Kernel)SHAP

Pythonによる実装の紹介 46

Feature Attribution法に関連する最近の研究 47

LIME・SHAPの懸念点 • 予測時間が⻑くなってしまう − 予測時に重み付き線形回帰を学習するため 48 予測モデルに対する間違った解釈を⽣む説明の⼀貫性の無さはユーザを不安にさせる
すぐに利⽤できない⼀部の事例しか⾒られない • 予測モデルで重要な特徴を捉えられる保証がない − 予測モデルと説明モデルが異なる形のため • 似た事例に対して異なる説明を出⼒する可能性 − 疑似事例のランダム性のため

LIME・SHAPの懸念点 • 予測時間が⻑くなってしまう − 予測時に重み付き線形回帰を学習するため 49 予測モデルに対する間違った解釈を⽣む説明の⼀貫性の無さはユーザを不安にさせる
すぐに利⽤できない⼀部の事例しか⾒られない • 予測モデルで重要な特徴を捉えられる保証がない − 予測モデルと説明モデルが異なる形のため • 似た事例に対して異なる説明を出⼒する可能性 − 疑似事例のランダム性のため速度忠実性⼀貫性

LIMEをベイズ化することで⼀貫性を上げる Bayesian LIME (BayLIME) 疑似事例が少ないとき LIMEは説明の⼀貫性がない 50 [Zhao+ 2021] LIMEによる説明の結果
(𝑛 = 100) ⼊⼒⼀貫性尤度: 事前分布: 事後分布: 𝝁9 = 𝑺9 :#𝜆𝑰; 𝝁7 + 𝑺9 :#𝛼𝑿+𝑾𝑿𝜷<=> 事後分布の平均: 事前分布を⼊れることで疑似事例数が少なくても⼀貫した説明が出やすくするパラメータ𝜆と𝛼の⼤きさで事前平均𝝁/ と最尤推定量𝜷012 の影響の⼤きさが決まる

LIMEをベイズ化することで⼀貫性を上げる Bayesian LIME (BayLIME) 51 [Zhao+ 2021] ⼀貫性実験結果同じテスト事例に対する説明の⼀貫性
𝝁/, 𝜆, 𝛼について適切な事前知識があれば⼀貫性のある説明を出⼒可能カーネルのバンド幅パラメータに対する頑健さ 𝝁/, 𝜆, 𝛼について適切な事前知識があればどんなバンド幅の値でも説明は安定

アンサンブル⽊で近傍事例を同定し局所線形モデルを学習 Model Agnostic suPervised Local Explanations (MAPLE) 52 [Plumb+ 2018]
図は https://blog.ml.cmu.edu/2019/07/13/ towards-interpretable-tree-ensembles/ から引⽤ 𝑤? = 𝑋? と𝑋が同じ葉に属する回数 𝑋が属する葉の数 1. アンサンブル⽊を学習し、テスト事例 𝑋 と同じ葉に到達する訓練事例をカウント 𝑘番⽬の⽊において、 𝑋' と𝑋( がテスト事例𝑋と同じ葉に所属 2. 同じ葉に所属する回数に応じて訓練事例を重み付け 3. 重み付けした訓練事例を⽤いて重み付き線形回帰モデルを学習 𝑘番⽬の⽊訓練事例 𝑋? の重み⼀貫性忠実性

解釈しやすく、⾮線形な振る舞いも捉えられるモデル Generalized Additive Model (GAM) • 各特徴量が予測値への貢献を決める関数 𝑓, を持つ −
関数 𝑓, の形を⾒れば、特徴量 𝑥, がどのように予測値に貢献するのか分かる 53 𝑦 = 𝛽7 + ; ,∈/ 𝑓, (𝑥, ) ⼀般化加法モデル (GAM) [Hastie+ 1986] • 関数 𝑓, の形：平滑化スプラインで決定忠実性速度

特徴量のペアワイズ項も考慮するGAMモデル GA2M / Explainable Boosting Machine (EBM) • 特徴量の各ペアにも関数を置くことで、特徴量の相互作⽤で予測値が変わる場合も
捉えられる 54 [Lou+ 2013, Nori+ 2019] 忠実性速度 𝑦 = 𝛽7 + ; ,∈/ 𝑓, (𝑥, ) + ; ,@A 𝑓,,A (𝑥, , 𝑥A ) ペアワイズ項を考慮したGAM 結果的に予測性能が上がる学習された特徴量の関数個々の特徴量ペアワイズ特徴量

特徴量のペアワイズ項も考慮するGAMモデル GA2M / Explainable Boosting Machine (EBM) 55 [Lou+ 2013,
Nori+ 2019] 忠実性速度基本の学習アルゴリズム ※予測時は⾼速だが学習には時間がかかる 𝒮 : 選択済み特徴量集合 𝒵 : 特徴量ペアの集合現在の𝒮を⽤いてGA2Mを最適化残差𝑅を求める各特徴量ペアにおいて予測器𝐹3 を学習最も残差を減らせる特徴量ペアを選択 𝑢∗を選択済み特徴量集合𝒮に追加

GAMの各特徴量の関数をニューラルネットで表現 Neural Additive Model (NAM) • GAMの各特徴量の関数 𝑓, 𝑥, をNN化
− 学習速度向上 • EBMのように関数の値が⼤きく変化できるように、特別な活性化関数を⽤いる 56 [Agarwal+ 2021] 𝑦 = 𝜎 𝛽 + ; ,∈/ 𝑓, 𝑥, 𝑓# 𝑥# 𝑓" 𝑥" 𝑓|/| 𝑥|/| NAM w/ ReLU NAM w/ ExU 忠実性速度

GAMの各特徴量の関数をニューラルネットで表現 Neural Additive Model (NAM) 57 [Agarwal+ 2021] 予測性能特徴量の関数の可視化（住宅価格データ）
サンフランシスコやカリフォルニアがある経度のところで価格が跳ね上がることを捉えている収⼊の中央値に対しては線形に変化忠実性速度精度はEBM と同等

予測と説明が⼀致するモデル（吉川の研究） 58 ニューラルネット特化型モデルガウス過程回帰特化型モデル Yuya Yoshikawa, and Tomoharu Iwata, “Neural
Generators of Sparse Local Linear Models for Achieving Both Accuracy and Interpretability,” Information Fusion, 2022. Yuya Yoshikawa, and Tomoharu Iwata, “Gaussian Process Regression With Interpretable Sample-wise Feature Weights,” IEEE Transactions on Neural Networks and Learning Systems, 2021.

ニューラルネット特化型モデルスパースな局所線形モデルのニューラル⽣成器 (NGSLL) • NGSLLのキーポイント − 局所線形モデルの係数 𝒘 を⽣成するニューラルネットを作ることで、事例ごとに異なる解釈可能な係数が推定できる
− ニューラルネットなので予測性能は⾼いまま維持できる − 予測と説明のギャップがない（＝忠実性が⾼い） 59 [Yoshikawa+ 2022] 通常のニューラルネット⼊⼒ 𝒙 NGSLL ⼊⼒ 𝒙 出⼒ 𝑦 係数 𝒘 出⼒ 𝑦 忠実性速度

ニューラルネット特化型モデルスパースな局所線形モデルのニューラル⽣成器 (NGSLL) 60 [Yoshikawa+ 2022] 忠実性速度

ニューラルネット特化型モデルスパースな局所線形モデルのニューラル⽣成器 (NGSLL) 61 [Yoshikawa+ 2022] 忠実性速度係数⽣成ネットワーク 𝒘
= 𝑊B (𝒙) 既存のNN（例: CNN）を使⽤可能

ニューラルネット特化型モデルスパースな局所線形モデルのニューラル⽣成器 (NGSLL) 62 [Yoshikawa+ 2022] 忠実性速度 𝐾-hotゲート⽣成モジュール重要な特徴を𝐾個選択する
𝒈 = 𝐺C,D (𝒘; 𝒎)

ニューラルネット特化型モデルスパースな局所線形モデルのニューラル⽣成器 (NGSLL) 63 [Yoshikawa+ 2022] 忠実性速度予測式ゲートで1が⽴つ特徴量のみ
係数を掛けて計算 𝑦 = ; ,∈/ 𝑤, 𝑔, 𝑧,

スパースな係数を⽣成する仕組み重要な係数を⼀つずつ選び、それだけ通す0/1ゲートベクトルを作る 64 Gumbel softmaxをK回適⽤（ただし、⼀度選ばれた特徴は⼆度と選ばない) 係数𝒘

ニューラルネット特化型モデルスパースな局所線形モデルのニューラル⽣成器 (NGSLL) 65 [Yoshikawa+ 2022] 忠実性速度予測時の計算時間予測時、NGSLLはForward計算のみ
なのでかなり⾼速予測性能 NGSLLは少ない特徴量でも低い予測誤差係数 𝒘 の⽣成結果⽩ピクセルは0、⿊ピクセルは1の特徴量の値 → ⿊ピクセルに対する係数のみが予測値に影響 NGSLLは適切に係数を割り当てている

ガウス過程回帰特化の解釈モデルガウス過程回帰で予測と同時に特徴の貢献を出⼒ • 局所説明付きガウス過程回帰 (GPX) − 局所線形モデルの係数をガウス過程から⽣成された関数で決定するようにモデル化 − 従来のガウス過程回帰と同等の予測性能 −
予測と説明のギャップがない（＝忠実性が⾼い） 66 [Yoshikawa+ 2021] ガウス過程回帰 (GP) ⾃⼰説明型ガウス過程回帰 (GPX) 𝑦 = 𝑓 𝑥 + 𝜖 𝑓 ⋅ ∼ 𝒩(0, 𝐾) 𝑦 = 𝑓 𝑥 + 𝜖 𝑓 𝑥 = ; ,∈/ 𝑤, 𝑥 𝑥, 𝑤, ⋅ ~ 𝒩(0, 𝐾) 忠実性速度⼀貫性

ガウス過程回帰特化の解釈モデルガウス過程回帰で予測と同時に特徴の貢献を出⼒ 67 [Yoshikawa+ 2021] 忠実性速度⼀貫性 • ガウス過程を仮定すると、係数
𝒘 が近傍事例で滑らかに変化するようになる → ⼀貫性が向上 • 係数 𝒘 の事後分布が得られる − 不確実性の評価が可能利点１利点２ GPXの利点

ガウス過程回帰特化の解釈モデルガウス過程回帰で予測と同時に特徴の貢献を出⼒ 68 [Yoshikawa+ 2021] 忠実性速度⼀貫性忠実性スコア⼀貫性スコア
計算時間 GPXは類似事例で似た説明を出⼒可能 GPXは予測時に⽐較的速い通常のGP同様の⾼速化が適⽤可能 GPXは予測モデルと説明モデルが同じ振る舞いをしている係数 𝒘 の⽣成結果

GPXのPythonライブラリ公開中 69 https://github.com/yuyay/gpx

解釈性の性能評価 • 正解データが存在しないケースがほとんどなので、直接的な定量評価は困難 • 代わりに、間接的な定量評価が⽤いられる − Fidelity > 近傍事例で予測モデルと説明モデルの予測値が⼀致しているか？ −
Stability > 近傍事例で説明が類似しているか？ − Faithfulness > 特徴量の貢献度とその特徴量を除いたときの予測値の変化の⼤きさは相関しているか？ 70

LIMEによる説明を改善させる正則化 Explanation-based Optimization (ExpO) • LIMEによる説明のFidelityとStabilityを上げられるように、予測モデルの学習時に正則化を⼊れる 71 [Plumb+ 2020]
学習のイメージ説明法 (LIME) 各事例の係数 𝒘 現在の予測モデルでLIMEを学習予測モデル 𝑓 近傍で説明を類似させつつ、予測誤差が下がるように予測モデル 𝑓 を更新忠実性⼀貫性係数𝒘のFidelity,Stabilityを上げる正則化

LIMEによる説明を改善させる正則化 Explanation-based Optimization (ExpO) Fidelity、Stabilityはほぼ確実に改善し、予測誤差も同等かそれ以下に⼩さくなる 72 [Plumb+ 2020] 回帰データセットでの実験結果予測誤差
Point Fidelity Neighb. Fidelity Stability 忠実性⼀貫性

LIMEによる説明を改善させる正則化 Explanation-based Optimization (ExpO) ExpOを使って学習したモデルは、説明を⾒れば少ないステップで⽬的の範囲の値にできる 73 [Plumb+ 2020] User
study • 被験者に特徴量の値を⾊々変えてもらい予測モデルの出⼒をある範囲にしてもらう • 特徴量の値を変えるごとに貢献度を表⽰しそれを⾒て被験者は次変える特徴量を決める忠実性⼀貫性タスク設定⼈間の感覚と合う説明と予測モデルの挙動になっている実験結果

より直接的な評価に向けて特徴量を改ざんし、説明法がそれを正しく検出できるかを評価 • 特徴量の⼀部に「改ざん」を⾏い、予測モデルが改ざん部分だけを使えば予測可能な状況を作り出す • その上で、説明法が改ざんした特徴量が重要と判定できるかを評価 74 [Zhou+ 2021]
改ざん改ざんした画像改ざんしたデータで学習した予測モデル説明法 LIME SHAP Grad-CAM ⁝ 改ざん特徴量の貢献度

より直接的な評価に向けて特徴量を改ざんし、説明法がそれを正しく検出できるかを評価 1. 正例だけ特徴量（ピクセル）を「改ざん」し、変化させた領域(Effective Region; ER)を記録 − 改ざんした特徴量のみとラベルが相関するように、ラベルは事前にランダムに変える
2. 改ざんしたデータセットで認識モデルを学習 − 認識モデルは改ざんした特徴量のみで⾼精度の認識が可能 3. 認識モデルをLIME等で説明 − どれだけ改ざんした領域の貢献度を⾼くできているかを Attr% ⋅ で評価 75 [Zhou+ 2021] ER (灰⾊の領域) Attr% 𝐹 = 改ざん領域𝐹の貢献度の総和全特徴量の貢献度の総和評価の⼿続き（画像の⼆値分類の例）改ざんの例

より直接的な評価に向けて特徴量を改ざんし、説明法がそれを正しく検出できるかを評価 • 予測モデルの精度は⾼いにも関わらず、どんな⼿法も𝐴𝑡𝑡𝑟% ≈ 1.0にならない • その中ではSHAPは良い⽅だった 76 [Zhou+
2021] 実験（どれだけ正確に改ざん部分を当てられているか） ER (改ざんした領域の⼤きさ) Attr% = 改ざん領域𝐹の貢献度の総和全特徴量の貢献度の総和期待結果改ざんした部分のみの貢献度を⾼くする（すなわち𝐴𝑡𝑡𝑟% ≈ 1.0） SHAP LIME GradCAM

まとめ • Feature Attribution法の代表的⼿法について紹介 − LIME：予測モデルの出⼒を局所線形モデルの係数で説明 − SHAP：Shapley値に基づいて、予測モデルにおける特徴量の貢献度で説明 • PythonによるLIMEの実装例の紹介
• 関連研究について、速度・忠実性・⼀貫性の観点でまとめて紹介 − BayLIME, MAPLE, GAM, GA2M, EBM, NAM, NGSLL, GPX, ExpO, 等 77 https://github.com/yuyay/DEIM2022_XAI_tutorial スライド、コードはこちらからダウンロードできます

参考図書：⽇本語で読めるXAIの専⾨書 • Interpretable Machine Learning (Webで無料) − XAI⼿法について網羅的に書かれた良書 − ㈱HACARUSによる⽇本語訳が公開されている
78 • XAI(説明可能なAI) --そのとき⼈⼯知能はどう考えたのか? • LIME, SHAP等の実装例が豊富で実務向き • ビジネス寄りの視点での解説 • 機械学習を解釈する技術〜予測⼒と説明⼒を両⽴する実践テクニック • 数式を⽤いた解説が豊富で、しっかり勉強したい⼈向け

参考⽂献 1/3 • [恵⽊ 2020] 恵⽊正史. “XAI(eXplainable AI)技術の研究動向.” ⽇本セキュリティ・マネジメント学会誌, vol.
34, no. 1, 2020, https://www.jstage.jst.go.jp/article/jssmjournal/34/1/34_20/_pdf/-char/ja. • [Ribeiro+ 2016] Ribeiro, Marco Tulio, et al. “ʻWhy Should I Trust You?ʼ: Explaining the Predictions of Any Classifier.” arXiv:1602.04938 [cs, Stat], Feb. 2016. arXiv.org, http://arxiv.org/abs/1602.04938. • [Lundberg+ 2017] Lundberg, Scott M., and Su-In Lee. “A Unified Approach to Interpreting Model Predictions.” Advances in Neural Information Processing Systems 30, edited by I. Guyon et al., Curran Associates, Inc., 2017, pp. 4765‒74. • [岡⽥ 2011] 岡⽥章. “ゲーム理論新版.” 有斐閣, 2011. • [森下 2021] 森下光之助. “機械学習を解釈する技術〜予測⼒と説明⼒を両⽴する実践テクニック.” 技術評論社, 2021. • [Yoshikawa+ 2021] Yoshikawa, Yuya, and Tomoharu Iwata. “Gaussian Process Regression With Interpretable Sample-Wise Feature Weights.” IEEE Transactions on Neural Networks and Learning Systems, vol. PP, Dec. 2021, https://doi.org/10.1109/TNNLS.2021.3131234. • [Yoshikawa+ 2022] Yoshikawa, Yuya, and Tomoharu Iwata. “Neural Generators of Sparse Local Linear Models for Achieving Both Accuracy and Interpretability.” An International Journal on Information Fusion, vol. 81, May 2022, pp. 116‒28. 79

参考⽂献 2/3 • [Lou+ 2013] Lou, Yin, et al. “Accurate
Intelligible Models with Pairwise Interactions.” Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Association for Computing Machinery, 2013, pp. 623‒31. • [Nori+ 2019] Nori, Harsha, et al. “InterpretML: A Unified Framework for Machine Learning Interpretability.” arXiv [cs.LG], 19 Sept. 2019, http://arxiv.org/abs/1909.09223. arXiv. • [Agarwal+ 2021] Agarwal, Rishabh, et al. “Neural Additive Models: Interpretable Machine Learning with Neural Nets.” arXiv [cs.LG], 29 Apr. 2020, http://arxiv.org/abs/2004.13912. arXiv. • [Hastie+ 1986] Hastie, Trevor, and Robert Tibshirani. “Generalized Additive Models.” Schweizerische Monatsschrift Fur Zahnheilkunde = Revue Mensuelle Suisse Dʼodonto-Stomatologie / SSO, vol. 1, no. 3, Aug. 1986, pp. 297‒310. 80

参考⽂献 3/3 • [Plumb+ 2018] Plumb, Gregory, et al. “Model
Agnostic Supervised Local Explanations.” arXiv [cs.LG], 8 July 2018, https://proceedings.neurips.cc/paper/2018/file/b495ce63ede0f4efc9eec62cb947c162-Paper.pdf. arXiv. • [Plumb+ 2020] Plumb, Gregory, et al. “Regularizing Black-Box Models for Improved Interpretability.” arXiv [cs.LG], 18 Feb. 2019, http://arxiv.org/abs/1902.06787. arXiv. • [Zhao+ 2021] Zhao, Xingyu, et al. “BayLIME: Bayesian Local Interpretable Model-Agnostic Explanations.” arXiv [cs.AI], 5 Dec. 2020, http://arxiv.org/abs/2012.03058. arXiv. • [Zhou+ 2022] Zhou, Yilun, et al. “Do Feature Attribution Methods Correctly Attribute Features?” arXiv [cs.LG], 27 Apr. 2021, http://arxiv.org/abs/2104.14403. arXiv. 81

DEIM2022チュートリアル「説明可能な機械学習入門 ～Feature Attributio...

DEIM2022チュートリアル「説明可能な機械学習入門 ～Feature Attribution法～」

More Decks by Yuya Yoshikawa

Other Decks in Research

Featured

Transcript

DEIM2022チュートリアル「説明可能な機械学習入門～Feature Attributio...

DEIM2022チュートリアル「説明可能な機械学習入門～Feature Attribution法～」