Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

「因果関係」をとらえるために / To grasp causal relationship

BrainPad
November 15, 2019

「因果関係」をとらえるために / To grasp causal relationship

ブレインパッド社内勉強会での発表スライドを公開しました
本スライドは #OpenBP の活動の一環として公開しています https://twitter.com/search?q=%23OpenBP&src=hashtag_click

#OpenBPとは→ https://note.mu/ysdyt/n/n46160f3348fe

BrainPad

November 15, 2019
Tweet

More Decks by BrainPad

Other Decks in Research

Transcript

  1. アプローチ 4 本書は、ゆるふわな調査報告書のようなものを目指します。 それゆえ、問題意識や概念の伝達・共有に特化致します。 数学的な詳細については可能な限り立ち入りませんので、専門書を紐解きください。 お話させていただくこと お話しないこと  問題意識 何故、統計的因果推論という分野が生まれなければならなかったのか

    を「因果を捉える」というヒトの営みから、俯瞰的にお話します。  概念 統計的因果推論のキーコンセプトにあたるものを、具体例をまじえ、 出来るだけ平易に記述致します。  評価 私個人がこの分野を学んでみての所感を、実務での有用性の観点から 延べさせていただきます。  手法の詳細 記載しはじめればきりが無く、詳細に述べるにはページ数が足りませ ぬ故、専門書を紐解きください。  実践例 実際に使ってみた感想はお話いたしません。ワンサンプルのケースス タディに終始してよいものではないと考えています。
  2. 経験的アプローチ Hillのガイドライン 13 因果とは何かという不毛な論争に明け暮れるのではなく、より実務的な観点から、因果を捉えようとする努力もありました。 疫学の分野で今でも使われているという Hillの因果関係判定のガイドラインは、ヒトが因果関係と認める際の傾向を分類・整理し、臨床現場 で役立てようとした試みの一つだと考えられます。 事象Aが事象Bの原因であると結論付けるための9基準 Source :

    星野(2017) より日本語訳を引用 原文はこちら 「すべての基準を満たすのは難しいが、満たす基準の数が多いほど、因果関係である可能性が高い」と考えるプラクティカルな姿勢 1 相関関係の強さ Aの生起とBの生起の間に強い相関関係がある。 2 相関関係の一致性 相関関係の大きさは、さまざまな状況で、対象や実証に利用する手法が違っても一致している。 3 相関関係の特異性 Bと「A以外に原因として想定される変数」の相関は高くない。またAと「B以外の結果変数」の相関も高くない。 4 時間的な先行性 AはBに時間的に先行する。 5 量・反応関係の成立 原因となる変数Aの値が大きくなると、単調に結果となる変数Bの値も大きくなる。 6 妥当性 AがBの原因になっているという因果関係が、生物学的に(または各分野の知見に基づいて)もっともらしい。 7 先行治験との整合性 これまでの先行研究や知見と首尾一貫している。 8 実験による知見 動物実験等での実験研究による証拠がある。 9 他の知見との類似性 すでに確立している別の因果関係と類似した関係・構造を有している。
  3. 全体像 17 一口に「統計的因果推論」といっても、この分野を構成する概念・手法は、様々な分野における因果推論の研究の蓄積から成ります。 統計的 因果推論 統計学 情報 科学 経済学 社会学

    心理学 医学/ 疫学 操作変数法 内生性 構造推定 LATE バックドア基準 フロントドア基準 構造方程式モデル 社会調査 リスク比・ オッズ比 コホート ケースコントロール 準実験 RD DD ATE マッチング 因果推論の根本問題 層別解析 傾向スコア 分野 概念 手法 IPW Rubin Causal Model 因果ダイアグラム 非巡回有効グラフ(DAG)に 基づいた因果推論の定式化 回帰モデルを軸とした 因果推論・政策評価が中心 古典的な統計学に基づいた アプローチ 因果構造の把握に注力 分野の特色 準実験的枠組みに基づく アプローチ 実験ベースの厳密な因果推論 品質管理 欠測値アプローチ
  4. 問題への解答 2つの潮流 19 因果関係を議論するにあたって、その定式化を試みたのが、二人のスーパースターです。 ルービン因果モデル(Rubin Causal Model / RCM) by

    Donald B. Rubin 反事実(潜在的結果)の推定というアプローチ 非巡回有効グラフによるバックドア・フロントドア基準 by Judea Pearl DAGを用いて交絡因子の影響を取り除いてくアプローチ 本書でご紹介
  5. ルービン因果モデル ①問題設定 20 ルービン因果モデル(Rubin Causal Model / RCM)のご紹介にあたり、分かりやすさを重視して、身近な具体例を併記いたします。 コンセプト 具体例

    ある個体 u について、処置 X が 結果 Y にもたらす因果効果を考える。 私について、転職 が所得 にもたらす因果効果を考える。 処置X 結果Y 転職 所得
  6. ルービン因果モデル ②因果効果の定義 21 処置に効果があったかどうかを判断するには、処置を受けた場合と受けなかった場合を比較するしかありません。 ルービン因果モデルでは、異なる処置による結果の差を因果効果として定義致します。 コンセプト 具体例 ある個体 u が、処置

    X を受けた場合の 結果 Y1 と、受けなかった場合の 結果 Y0 を比較する。 私が、転職 した場合の 所得 Y1 と、転職しなかった場合の 所得 Y0 を 比較する。 私 所得 Y1 所得 Y0 転職する 転職しない 結果 Y1 結果 Y0 処置 X アリ 個体 u 二つの結果を比較する 処置 X ナシ
  7. ルービン因果モデル ③推論の根本問題 22 当たり前ですが、処置を受けた場合と受けなかった場合の両方の結果を観測することは不可能です。 この当然の前提を、「因果推論の根本問題(Fundamental Problem in Causal Inference)」として明に認めるのがRCMの特徴です。 コンセプト

    具体例 ある個体 u が、処置 X を受けた場合の 結果 Y1 と、受けなかった場合の 結果 Y0 を共に観測することは出来ない。 私が、転職 した場合の 所得 Y1 と、転職しなかった場合の 所得 Y0 を 共に観測することは出来ない。 私 所得 Y1 所得 Y0 転職する 転職しない 結果 Y1 結果 Y0 処置 X アリ 個体 u どちらか一方の世界のみが観測可能 処置 X ナシ
  8. ルービン因果モデル ④問題の解決方法 23 もう一つの世界を観測できないのならば、その世界を何かしらの方法で構築し、その結果を推察すればよい、のではないでしょうか。 コンセプト 具体例 ある個体 u が、処置 X

    を受けた場合の 結果 Y1 のみを観測している場合、 処置 X 受けなかった場合の結果 Y0* を予想して、比較すればよい。 私が、転職 した場合の 所得 Y1 と、転職しなかった場合の 所得 Y0 を 予想して、比較すればよい。 私 所得 Y1 所得 Y0* 転職する 転職しない 結果 Y1 結果 Y0* 処置 X アリ 個体 u 処置の無かった世界の結果 Y0*を推定して、比較する 処置 X ナシ
  9. ルービン因果モデル ⑥古典的な手法 ランダム化比較試験 25 反事実の構築方法の中で、古典的かつ最も有効な手法が、ランダム化比較試験(Randomized Controlled Trial/ RCT)、すなわち、実験です。 処置の割当をランダムに行うことで、集団間の差異を少なくし、事実-反事実の比較を可能にする手法です。 様々な手法が割拠する中で、RCTは因果推論のゴールドスタンダードであり続けています。

    しかしながら、対象が人間の場合、処置をランダムに振り強要することは倫理的に難しいため、実際の活用範囲は医学(治験)程度に限られ、 このことが社会行動を対象とする分野での因果推論を困難にさせています。 コンセプト 具体例 ある個体 u ではなく、同質性を持ったある集団に対して、処置 X をラン ダムに割り振り、処置を受けた集団の 結果の期待値 E(Y1) と受けなかっ た集団の 結果の期待値 E(Y0*) を比較する。 私のような、20代男性IT系企業の社員の集団に対して、転職 をランダム に強要し、転職した集団の 所得 Y1 の平均値と、転職しなかった集団の 所得 Y0 の平均値を比較する。 結果 Y1 結果 Y0* 処置 X アリ ランダムな割り当て 集団 処置 X ナシ 結果 Y1 結果 Y0* 転職させる ランダムな割り当て 20代男性IT系 企業の社員 転職させない
  10. 統計的因果推論の諸手法 と、その整理 26 本書のフォーカスではありませんが、統計的因果推論で頻出する手法は下表のとおりです。 数学的詳細は専門書を紐解きください。 手法 概要 仮定 分かりやすさ 適用しやすさ

    エビデンスの強さ 操作変数法 操作変数と回帰モデルによる因果推論 操作変数の特定 × × ◎ 不連続回帰デザイン 処置変数のカットオフ(恣意的な切れ目)の前後差比較 カットオフポイントの存在 △ △ ◎ 差分の差法 時系列データを用いた通称「前年同月比比較」 共通トレンド ◎ △ ◎ 傾向スコア 複数の共変量を1変数に次元縮約 △ ◎ △ マッチング 共変量の似た者同士を結び付けて反事実を構築 ◎ ◎ △ 層化解析法 層別に集計 ◎ ◎ × 逆確率重み付け法 層別の処置・非処置比率をもとに平均処置効果を推定 × △ △ 共変量の完全測定 統計的因果推論の諸手法 エビデンスとしては強いが、 適用しづらい手法 (偶発的な状況に依存) 適用しやすいが、 エビデンスとしては弱い手法 (共変量の完全測定が必要)
  11. ルービン因果モデル ⑦新しい手法 マッチング 27 RCTが出来ない環境下での統計的因果推論の一つの手法として、マッチングがあります。 コンセプト 具体例 処置 X を受けた

    個体 u とその個体によく似ていて処置を受けなかった 個体 u* を探し出し、それぞれの結果を比較する。 転職した私に似た、転職していない白金台出身20代男性IT企業社員(読 書が趣味)の所得を比較する。 私 所得 Y1 所得 Y0* 転職した 転職していない 結果 Y1 結果 Y0* 処置 X アリ 個体 u 処置の異なる似た個体を用意し、結果を比較 処置 X ナシ 個体 u 白金台出身20代男性IT企業社員(読書が趣味)
  12. 条件 満たさねばならないこと 28 統計的因果推論も推論形式の一つである以上、適用するにはいくつかの条件が必要です。 そして、必要な条件は、用いる研究手法によって異なります。 実験研究 処置のランダムな割当が可能、 すなわち RCT が可能

    観察研究 処置のランダムな割当が不可能、 すなわち、処置は個体によって選択されており、 研究者はその結果を観察するしかない 研究 デザイン 必要 SUTVA 必要 不要 RCTを行うことで 自動的に満たされる 強く無視できる 割り当て条件 必要 条件 普段の業務で 直面する状況
  13. 条件① 最も重要な仮定 29 統計的因果推論に必要な条件の中で、最も重要かつ基本的なものの一つが、SUTVA(Stable Unit Treatment Value Assumption)条件です。 ①相互干渉の排除と、②処置の一意性からなる条件です。 コンセプト

    具体例 ① 個体間に相互干渉が無い。 ②処置は一意に決まる。 ①ある人の行動が他の人に影響しない。  ある人の転職により、労働市場の需要が下がるなどして、他の人の転 職確率が低くならない  ある人が転職したという事実が、他の人の転職行動に心理的な側面で 影響しない etc … ② 処置は転職か、転職しないの2択であり、そのほかは存在しない。  社内の部署移動や出向などで、所得が変わるといった状況が無い  転職の処置を受けた人が転職しないなどといった処置への不順守が存 在しない。 etc… 個体 1 個体 2 個体 3 互いに 無干渉 個体 処置 X1 処置 X2 ×
  14. 条件② 観察研究において 30 SUTVA条件を満たしているだけではまだまだです。 実験をせずに因果推論する場合、強く無視できる割り当て条件(Strongly Ignorable Treatment Assignment)を手元にあるデータが満たして いる必要があります。 すなわち、処置の割当は共変量のみに依存するけれども、結果変数には依存しない、との仮定です。(ややこしいですよね….)

    コンセプト 具体例 共変量 X が同じであれば、処置有・無のそれぞれの結果変数の 同時分布(Y1, Y0) と 処置変数 X は独立である。 白金台出身20代男性IT企業社員(読書が趣味)であれば、転職・非転職 時の所得の同時分布と転職するかどうかの意思(確率)は独立である。 結果 Y1 結果 Y0 処置 X 共変 量 X 転職時 所得 今の 所得 転職 確率 白金台 出身… 共変量が同じ集団は、処置の割り当てがランダムに行われたと想定してよい、という仮定 (※この仮定はデータ生成プロセスに究極的に依存するため、手元のデータから立証できるものでは無く、実質的に立証不可能。)
  15. エビデンスレベル そのシビアさ 31 医学・疫学など、研究結果が非常にクリティカルに影響してしまう分野において、因果を論証することは非常に大変です。 患者データに基づかない、専門委員会や専門家個人の意見 記述研究(症例報告やケースシリーズ) 分析疫学的研究(症例対照研究、横断研究) 分析疫学的研究(コホート研究) 非ランダム化比較試験 1つ以上のランダム化比較試験

    システマティック・レビュー/ ランダム化比較試験のメタアナリシス Ⅱ Ⅲ Ⅳa Ⅳb Ⅴ Ⅵ Ⅰ 高 低 実 験 研 究 観 察 研 究 因果関係の立証と見なされうるもの Source : 日経メディカル RCTの無い研究をどこまで積み上げた ところで、因果関係の立証とはみなさ れない
  16. 実験研究の難しさ たとえ実験が出来たとしても 32 種々考えなければならない問題がございます。 被験者が人である以上、心理的側面への強い配慮が必要となります。 倫理的妥当性 処置の割り当てによる強制が倫理的に許容されるか否か。 ホーソン効果 通常よりもポジティブ・ネガティブな環境に置かれることにより、被験者の行動が変わってしまうこと。 ピグマリオン効果

    被験者が研究者の期待に無意識のうちに影響され、研究者の意図に沿うような行動をしてしまうこと。(ローゼンタール効果) コストの高さ 被験者を準備するのにかかるコストが莫大。 外的妥当性の欠如 少数の選抜されたサンプルからなる実験となりやすいため、そこから得られた結果を一般化出来ないこと。 ノンコンプライアンス 割り当てられた処置を被験者が実行しないこと。
  17. 射程 できること、できないこと 33 因果推論のための研究手法が種々ある中で、統計的因果推論がその力を最も発揮するのは、観察研究においてです。 ただし、強く無視できる割り当て条件が満たされる範囲に限られます。 そして往々にして、この条件の立証は不可能です。 実験研究 処置のランダムな割当が可能 観察研究 処置のランダムな割当が不可能

    研究手法 自然実験 偶然起きた実験的環境を利用 疑似実験 疑似的な実験的枠組みを 統計的に構築 単純な 分析 手元にあるデータのみで分析 (集計・相関・回帰 etc…) 〇 〇 × 〇 因果効果の立証 Yes No 統計的因果推論の諸手法が力を発揮する範囲 (シンプソンパラドッ クス・疑似相関を回避 する術はない) 手元にあるデータが強く無視できる割り当て条件を満たしているのであれば、疑似実験の手法を用いて、因果推論が可能になる。 強く無視できる 割り当て条件
  18. 評価 私見もふまえて 36 「因果関係」という不確かなものに対して、統計的因果推論は、数学・確率論・統計学を武器に立ち向かいます。 そのフレームワークの明瞭さ・分かりやすさは、因果関係の議論の土台を提供するのに非常に有用でしょう。 しかしながら、実務における統計的因果推論の有用性は、限定的だと思われます。 ポジティブ ネガティブ  単純かつ明快なフレームワーク

    「観測できない反事実を推定し、比較する」という論理は非常にシン プルかつ明快で非専門家にとっても分かりやすく、また汎用的である  定量的な効果把握のための汎用的な手法の提供 因果の有無という抽象的な問いではなく、因果の効果という具体的か つ定量的な問いに対する解法を一般的な形で提供している  アカデミックなレベルでのエビデンスの強さ 医学・疫学含め多様なアカデミックの各分野で因果推論の手法として 利用されており、推論結果のエビデンスとしての信頼性は非常に高い  立証不可能な仮定に基づく難解な手法 各手法の背景となる数理・統計概念が難解で、多くの場合データから は立証不可能な仮定に基づかなければならない  手法の正しさ・良さを巡る問い 様々な手法のどれがより正しいのか、より良いのかを決める議論が未 成熟であり、手法毎に異なる因果効果が算出され、併存してしまう  適用コストの大きさ 一つの原因に対する一つの結果を厳密に論証するスタイルであるため、 論証にかかる時間的コストが大きい 時間がかかっても、仮説・命題の正しさを一般的な形式で論証することが 求められるアカデミックの場では、適用がしやすい 仮説を早く・安く・分かりやすく立証し、施策化することが求められる ビジネス実務の場では、適用が難しい
  19. Guiding Principles for Evidence-Based Policymaking 37 最近では、行政の世界で、エビデンスに基づいた政策立案(Evidence-Based Policymaking / EBPM

    )を進める動きが盛んらしいです。 アメリカの連邦議会には、「エビデンスに基づく政策立案委員会 (Commission on Evidence-Based Policymaking / CEM)」があり、 行政におけるEBPMを促進しているようです。 このCEMが提言しているガイドラインは、分析官の職業規範として意識しておいてよいかもしれません。 エビデンスに基づくマーケティング(EBM)に言い換えても、さほどおかしくはないでしょうし。 Source : The Promise of Evidence-Based Policymaking 1. プライバシー 2. 厳密さ 3. 透明性 4. 謙虚さ 5. 有能さ 個人のプライバシーを尊重せよ 研究デザイン・方法に最新の注意を払え エビデンスはそのプロセスと共に適切に公 開されよ 過度に一般化することなかれ 必要なスキルをもつ人材を集めよ エビデンスに基づく政策立案のためのガイドライン (こちらを参考に拙訳)
  20. ビジネスにおける実装 統計的因果推論は使えるのか 38 直接的に、手法を適用することは難しいでしょう。 考えなければならない点も多々あります。  エビデンスの強さはどこまで求められるのか? 緻密な論証が求められる場合もあれば、何か示唆や兆候が得られる程度良いという場合もあり、すべては顧客要望次第だと言ってしまえばそ の通りです。 しかし実際のところ、どこまでのエビデンスレベルであれば、ビジネスの場で有用な知見となりうるのか、疑問です。

    厳密 な論証でもなく、単純な集計でもない、バランスのとれたポジションはどこにあるのでしょうか?  どの手法が最もコスパが良いか? 一口に統計的因果推論と入っても、その箱の中にあるツールは多種多様です。 それゆえに分析者は、「結局どの手法を使えばよいのか」と いう問いに直面せざるを得ません。 予測モデルように、何かしらの数理的な基準に基づき、手法の優劣を決定することが出来ない以上(私 の知る限り、おそらく、ですが)、エビデンスの強さ、コストの大きさ(主にはコーディング量でしょうか)、非専門家にとっての(そして 分析者自身にとっての)分かりやすさなどの複数の観点から、どの手法から適用を考えていくべきか、総合的に考察せざるを得ないように思 われますが、本当にそれでよいのでしょうか?  非専門家にどのように推論結果を伝えれば良いのか? 統計的因果推論の諸手法は、決して分かりやすいものではありません。しかし一方で、その結果を使って実際に施策の立案をするのは、往々 にして非専門家の方々です。 彼らが十分に納得し、自身の施策案の論理的根拠として確信し、武装できるようなものを分析者は提出するこ とが望まれますし、またそう説明されることを望まれているはずです。 そのようなニーズの中で、厳密さを維持し、過度の一般化を避けつ つ、それでも分かりやすく分析結果を伝え、納得していただくには、どうすれば良いのでしょうか?
  21. レファレンス 興味をもってくださった方に 40 本書の情報のほとんどは、複数の書籍・サイト・論文を参照しております。 ここでは、特におすすめの二つの情報源をご紹介致します。  入門書としてお勧めの一冊。 今更入門書…と思われる方も、ぜひ。  法学分野でミクロ計量経済学のアプローチで研究されている方が、連載で書かれていたものを一冊

    にまとめたものです。  入門書ではありますが、分析(特に因果推論)をする上での概念や考え方、お作法の要所をレベル を落とさず語っているように感じます。  読んでて退屈しませんでした。  お勧めのサイトの一つ。  環境リスクの研究者の方のブログです。  分析実務に関わる方へ示唆に富んだ記事を多く執筆されています。  確率・統計の考え方や手法を現実世界に当てはめようとすると何が起きるのか、という点に非常に 繊細な注意を払われており、真摯な姿勢を感じます。