Slide 7
Slide 7 text
Feature attribution methods
7
Feature attributionは各データ毎に、与えられた出力に対する特徴量寄与度を
計算するモデル解釈手法。主な手法は以下の通り。
Additive feature attribution
Gradient-based attribution
- 学習モデルを特徴量寄与度の総和として近似(右式参照)
- LIME, SHAPなどが該当のモデル解釈手法
- 予測値や評価指標値に対する特徴量の勾配ベクトルから解釈
- Gradient, GradCAM, SmoothGrad などが該当のモデル解釈手法
その他
- (例)モデルのパラメータから直接解釈
- 線形モデル, Attention score, Rationale model