Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SHAPで因果関係を説明できる?

 SHAPで因果関係を説明できる?

うとしん

June 19, 2023
Tweet

More Decks by うとしん

Other Decks in Science

Transcript

  1. 観測できるデータと観測できないデータ(交絡)がある 特徴量(観測可) 概要 Sales calls 訪問販売の回数 Interactions 交流回数 Economy 居住地域の経済状況

    Last upgrade 最終更新日 Discount 割引額 Monthly usage 月の利用度合い Ad spend 広告費用 Bugs reported バグの報告回数 問題設定 特徴量(観測不可) 概要 Product need プロダクトのニーズ Bugs faced バグの遭遇回数 今回のシミュレーションではデータの生成過程 が既知なので,未観測(という設定)ながらサ ブスクの継続に影響があることは分かっている 目的変数 概要 Did renew サブスク更新の有無
  2. 目的(予測タスクor因果タスク)による 予測タスクの例 サブスク更新の有無を予測する精度を 高めて,将来の収益を推定し,財務計 画の意思決定に繋げたい > SHAP値が高い特徴量を知ることで 予測精度に向上に役立てることが可能 (SHAP値は有用) SHAP値は無意味?

    因果タスクの例 できるだけ多くのユーザーのサブスク 更新確率を上げるようなアクションの 意思決定に繋げたい > 基本的にはSHAP値をそのまま因果 関係と解釈することはできない (SHAP値の有用ではない)
  3. CSV: Causal Shapley Values Pearlのdo-calculusを応用して計算する”因果的な”Shapley values CSVのココがすごい(1) 特徴量間の独立性を必要としない > 既存のShapley

    valuesは特徴量間の 独立性が満たされていない場合,先ほ ど説明した(Discountの例)ような ミスリーディングに繋がることがある CSVのココがすごい(2) すべての因果効果を直接効果と間接効 果に分けて算出できる 特徴量1 特徴量2 目的変数 直接効果 間接効果