「因果関係」をとらえるために / To grasp causal relationship

「因果関係」をとらえるために統計的因果推論に関する自由研究

3行サマリー 2 本書で申し上げたいことを3行でまとめさせていただきました。  因果関係を定量的に捉える一つの枠組みとして、統計的因果推論という方法が注目されています。  この方法の大きな特徴は、原因がある場合と無い場合の結果の差を考える際、実際に観測できなかった方の結果（反事実）を統計的に推定することで、結果の比較を実現する点にあります。  その論証スタイルの厳密さから、アカデミックな場ではすでに広く使われていますが、分析コスト
を考慮すると、ビジネスにおける直接適用は難しいかもしれません。しかしながら、因果を考える際の基本的なフレームワークとしては、ビジネスの場でも非常に有用だと思われます。

目次 3 3本立てでございます。 1.問題意識 2.概念の整理 3.評価

アプローチ 4 本書は、ゆるふわな調査報告書のようなものを目指します。それゆえ、問題意識や概念の伝達・共有に特化致します。数学的な詳細については可能な限り立ち入りませんので、専門書を紐解きください。お話させていただくことお話しないこと  問題意識何故、統計的因果推論という分野が生まれなければならなかったのか
を「因果を捉える」というヒトの営みから、俯瞰的にお話します。  概念統計的因果推論のキーコンセプトにあたるものを、具体例をまじえ、出来るだけ平易に記述致します。  評価私個人がこの分野を学んでみての所感を、実務での有用性の観点から延べさせていただきます。  手法の詳細記載しはじめればきりが無く、詳細に述べるにはページ数が足りませぬ故、専門書を紐解きください。  実践例実際に使ってみた感想はお話いたしません。ワンサンプルのケーススタディに終始してよいものではないと考えています。

1. 問題意識 5

「相関は因果ではありません」 6 と、統計学の教科書の1ページ目に書いてありました。 Wikipediaにもありました。

「予測は因果を示さない」 7 どんなに良い予測モデルが出来ようと、その予測モデルから因果関係の予想は出来ても、立証はできない(はず)です。予測モデルが語りうる世界真なる因果関係私の頭の中のイメージ図重なる部分はあったとしても、ただそれだけ。

問題意識我々が出来るのは相関を示すことだけなのかもしれないけど 8 そしておそらく、皆さまの中にも、同じ問題意識をお持ちの方がいらっしゃるかもしれません。（だとちょっと嬉しいです。）本当の因果関係って、どうすれば立証できるんですか？いや、プラクティカルに考えるなら、「因果関係がある」と主張するにはどのようなことを示せばよいのでしょうか？いや、もっと根源的に考えてよいのなら、「私は今、正しい因果関係の答えにたどり着いている」
ということを知るすべは、どこにあるのでしょうか？原因結果

因果を捉えることの難しさ「因果関係」を定義できますか？ 9 実は、「因果関係」を真面目に考えようとすると、いろいろと大変です。ありふれていて、手になじんだ言葉であるからこそ、言語化するのは大変です。コンビニでの傘の売上本数降水確率 1ヶ月間に朝食をとる回数算数の成績風速
桶屋の営業利益

因果を捉えるアプローチヒトの営みの一つとして 10 様々なアプローチで「因果」が研究されてきました。思想的アプローチ因果関係が何たるかを概念的に考察し、定義化を試みる。経験的アプローチヒトが因果関係を見出す際の思考傾向の分類を行い、類推する。統計学的アプローチ因果の有無ではなく、因果関係の効果を定量的に把握することに専念する。
→ 統計的因果推論

思想的アプローチ① 少しスケールを大きくして 11 「因果関係」という不確かなものに言葉と実を与えようとする試みは、古代より続いていきた、のかもしれません。不動の動者特にキリスト教神学の考え方。究極的には、超越者がすべてを規定します。因果応報仏教的な考え方。行為の善悪がもたらす帰結を重視します。
懐疑論ヒュームという思想家の考え方。因果関係の存在のあやふやさを指摘します。ラプラスの悪魔近代科学が前提とする考え方。データがあるのなら、すべては予測できると主張します。

思想的アプローチ② 最近では 12 さらに豊かに、混沌と。量子力学現代物理学のパラダイム。確率論的な、非決定的な決定性を軸とします。（あまり知らないです。専門家の方、ごめんなさい）複数世界「世界が複数存在し、今私がいるのはその一つの世界である」というSFのような話を、
真面目に銀論します。プラグマティズム近年の新潮流。因果関係を含めた知識の確実性の根拠を議論するための土台を提供します。

経験的アプローチ Hillのガイドライン 13 因果とは何かという不毛な論争に明け暮れるのではなく、より実務的な観点から、因果を捉えようとする努力もありました。疫学の分野で今でも使われているという Hillの因果関係判定のガイドラインは、ヒトが因果関係と認める際の傾向を分類・整理し、臨床現場で役立てようとした試みの一つだと考えられます。事象Aが事象Bの原因であると結論付けるための9基準 Source :
星野(2017) より日本語訳を引用原文はこちら「すべての基準を満たすのは難しいが、満たす基準の数が多いほど、因果関係である可能性が高い」と考えるプラクティカルな姿勢 1 相関関係の強さ Aの生起とBの生起の間に強い相関関係がある。 2 相関関係の一致性相関関係の大きさは、さまざまな状況で、対象や実証に利用する手法が違っても一致している。 3 相関関係の特異性 Bと「A以外に原因として想定される変数」の相関は高くない。またAと「B以外の結果変数」の相関も高くない。 4 時間的な先行性 AはBに時間的に先行する。 5 量・反応関係の成立原因となる変数Aの値が大きくなると、単調に結果となる変数Bの値も大きくなる。 6 妥当性 AがBの原因になっているという因果関係が、生物学的に（または各分野の知見に基づいて）もっともらしい。 7 先行治験との整合性これまでの先行研究や知見と首尾一貫している。 8 実験による知見動物実験等での実験研究による証拠がある。 9 他の知見との類似性すでに確立している別の因果関係と類似した関係・構造を有している。

統計学的アプローチ統計的因果推論の誕生 14 より定量的に因果関係を捉える試みとして、因果の効果に着目し、統計学的手法を応用しながら発展してきたのが、統計的因果推論とそれに関連する諸分野です。 Donald B. Rubin (1943~) この分野の始祖的存在。因果推論共通フレームワークとして、
ルービン因果モデルを開発。 Judea Pearl (1936~) 非巡回有向グラフによる因果推論を発展させた人物。人工知能研究者としても非常に有名。二人のスーパースター

統計的因果推論、はじめました。 15 本書はその過程で学んだこと（そして現在進行形で学んでいること）のまとめになります。

2. 概念の整理 16

全体像 17 一口に「統計的因果推論」といっても、この分野を構成する概念・手法は、様々な分野における因果推論の研究の蓄積から成ります。統計的因果推論統計学情報科学経済学社会学
心理学医学/ 疫学操作変数法内生性構造推定 LATE バックドア基準フロントドア基準構造方程式モデル社会調査リスク比・オッズ比コホートケースコントロール準実験 RD DD ATE マッチング因果推論の根本問題層別解析傾向スコア分野概念手法 IPW Rubin Causal Model 因果ダイアグラム非巡回有効グラフ（DAG）に基づいた因果推論の定式化回帰モデルを軸とした因果推論・政策評価が中心古典的な統計学に基づいたアプローチ因果構造の把握に注力分野の特色準実験的枠組みに基づくアプローチ実験ベースの厳密な因果推論品質管理欠測値アプローチ

共通する問題意識 18 種々分野はございますし、アプローチも異なりますが、問題意識は共通です。実験が出来ない中で、観察から得られたデータ、すなわち偏りのあるデータだけをもとに因果関係を推論するには、どうすれば良いのか？

問題への解答 2つの潮流 19 因果関係を議論するにあたって、その定式化を試みたのが、二人のスーパースターです。ルービン因果モデル（Rubin Causal Model / RCM） by
Donald B. Rubin 反事実（潜在的結果）の推定というアプローチ非巡回有効グラフによるバックドア・フロントドア基準 by Judea Pearl DAGを用いて交絡因子の影響を取り除いてくアプローチ本書でご紹介

ルービン因果モデル ①問題設定 20 ルービン因果モデル（Rubin Causal Model / RCM）のご紹介にあたり、分かりやすさを重視して、身近な具体例を併記いたします。コンセプト具体例
ある個体 u について、処置 X が結果 Y にもたらす因果効果を考える。私について、転職が所得にもたらす因果効果を考える。処置X 結果Y 転職所得

ルービン因果モデル ②因果効果の定義 21 処置に効果があったかどうかを判断するには、処置を受けた場合と受けなかった場合を比較するしかありません。ルービン因果モデルでは、異なる処置による結果の差を因果効果として定義致します。コンセプト具体例ある個体 u が、処置
X を受けた場合の結果 Y1 と、受けなかった場合の結果 Y0 を比較する。私が、転職した場合の所得 Y1 と、転職しなかった場合の所得 Y0 を比較する。私所得 Y1 所得 Y0 転職する転職しない結果 Y1 結果 Y0 処置 X アリ個体 u 二つの結果を比較する処置 X ナシ

ルービン因果モデル ③推論の根本問題 22 当たり前ですが、処置を受けた場合と受けなかった場合の両方の結果を観測することは不可能です。この当然の前提を、「因果推論の根本問題（Fundamental Problem in Causal Inference）」として明に認めるのがRCMの特徴です。コンセプト
具体例ある個体 u が、処置 X を受けた場合の結果 Y1 と、受けなかった場合の結果 Y0 を共に観測することは出来ない。私が、転職した場合の所得 Y1 と、転職しなかった場合の所得 Y0 を共に観測することは出来ない。私所得 Y1 所得 Y0 転職する転職しない結果 Y1 結果 Y0 処置 X アリ個体 u どちらか一方の世界のみが観測可能処置 X ナシ

ルービン因果モデル ④問題の解決方法 23 もう一つの世界を観測できないのならば、その世界を何かしらの方法で構築し、その結果を推察すればよい、のではないでしょうか。コンセプト具体例ある個体 u が、処置 X
を受けた場合の結果 Y1 のみを観測している場合、処置 X 受けなかった場合の結果 Y0* を予想して、比較すればよい。私が、転職した場合の所得 Y1 と、転職しなかった場合の所得 Y0 を予想して、比較すればよい。私所得 Y1 所得 Y0* 転職する転職しない結果 Y1 結果 Y0* 処置 X アリ個体 u 処置の無かった世界の結果 Y0*を推定して、比較する処置 X ナシ

ルービン因果モデル ⑤まとめると 24 ルービン因果モデルは、処置の無かった（もしくはあった）世界の結果の観測は不可能であるという認識のもと、この反事実の世界（Counterfactual）における結果を推定し、因果効果を推定しようとします。当然、カギとなるのは、いかに妥当な反事実を構築できるか、にあります。未知の真の値を手元にある情報を用いて推定するための人類の武器、統計学の出番です。コンセプトある個体 u
が、処置 X を受けた場合の結果 Y1 と、反事実である処置 X 受けなかった場合の結果 Y0* を推定し、比較する。結果 Y1 結果 Y0* 処置 X アリ個体 u 反事実処置 X ナシ事実妥当な反事実を構築するために、統計学を駆使統計的因果推論の諸手法

ルービン因果モデル ⑥古典的な手法ランダム化比較試験 25 反事実の構築方法の中で、古典的かつ最も有効な手法が、ランダム化比較試験（Randomized Controlled Trial/ RCT）、すなわち、実験です。処置の割当をランダムに行うことで、集団間の差異を少なくし、事実-反事実の比較を可能にする手法です。様々な手法が割拠する中で、RCTは因果推論のゴールドスタンダードであり続けています。
しかしながら、対象が人間の場合、処置をランダムに振り強要することは倫理的に難しいため、実際の活用範囲は医学（治験）程度に限られ、このことが社会行動を対象とする分野での因果推論を困難にさせています。コンセプト具体例ある個体 u ではなく、同質性を持ったある集団に対して、処置 X をランダムに割り振り、処置を受けた集団の結果の期待値 E(Y1) と受けなかった集団の結果の期待値 E(Y0*) を比較する。私のような、20代男性IT系企業の社員の集団に対して、転職をランダムに強要し、転職した集団の所得 Y1 の平均値と、転職しなかった集団の所得 Y0 の平均値を比較する。結果 Y1 結果 Y0* 処置 X アリランダムな割り当て集団処置 X ナシ結果 Y1 結果 Y0* 転職させるランダムな割り当て 20代男性IT系企業の社員転職させない

統計的因果推論の諸手法と、その整理 26 本書のフォーカスではありませんが、統計的因果推論で頻出する手法は下表のとおりです。数学的詳細は専門書を紐解きください。手法概要仮定分かりやすさ適用しやすさ
エビデンスの強さ操作変数法操作変数と回帰モデルによる因果推論操作変数の特定 × × ◎ 不連続回帰デザイン処置変数のカットオフ（恣意的な切れ目）の前後差比較カットオフポイントの存在 △ △ ◎ 差分の差法時系列データを用いた通称「前年同月比比較」共通トレンド ◎ △ ◎ 傾向スコア複数の共変量を1変数に次元縮約 △ ◎ △ マッチング共変量の似た者同士を結び付けて反事実を構築 ◎ ◎ △ 層化解析法層別に集計 ◎ ◎ × 逆確率重み付け法層別の処置・非処置比率をもとに平均処置効果を推定 × △ △ 共変量の完全測定統計的因果推論の諸手法エビデンスとしては強いが、適用しづらい手法（偶発的な状況に依存）適用しやすいが、エビデンスとしては弱い手法（共変量の完全測定が必要）

ルービン因果モデル ⑦新しい手法マッチング 27 RCTが出来ない環境下での統計的因果推論の一つの手法として、マッチングがあります。コンセプト具体例処置 X を受けた
個体 u とその個体によく似ていて処置を受けなかった個体 u* を探し出し、それぞれの結果を比較する。転職した私に似た、転職していない白金台出身20代男性IT企業社員（読書が趣味）の所得を比較する。私所得 Y1 所得 Y0* 転職した転職していない結果 Y1 結果 Y0* 処置 X アリ個体 u 処置の異なる似た個体を用意し、結果を比較処置 X ナシ個体 u 白金台出身20代男性IT企業社員（読書が趣味）

条件満たさねばならないこと 28 統計的因果推論も推論形式の一つである以上、適用するにはいくつかの条件が必要です。そして、必要な条件は、用いる研究手法によって異なります。実験研究処置のランダムな割当が可能、すなわち RCT が可能
観察研究処置のランダムな割当が不可能、すなわち、処置は個体によって選択されており、研究者はその結果を観察するしかない研究デザイン必要 SUTVA 必要不要 RCTを行うことで自動的に満たされる強く無視できる割り当て条件必要条件普段の業務で直面する状況

条件① 最も重要な仮定 29 統計的因果推論に必要な条件の中で、最も重要かつ基本的なものの一つが、SUTVA（Stable Unit Treatment Value Assumption）条件です。 ①相互干渉の排除と、②処置の一意性からなる条件です。コンセプト
具体例 ① 個体間に相互干渉が無い。 ②処置は一意に決まる。 ①ある人の行動が他の人に影響しない。  ある人の転職により、労働市場の需要が下がるなどして、他の人の転職確率が低くならない  ある人が転職したという事実が、他の人の転職行動に心理的な側面で影響しない etc … ② 処置は転職か、転職しないの2択であり、そのほかは存在しない。  社内の部署移動や出向などで、所得が変わるといった状況が無い  転職の処置を受けた人が転職しないなどといった処置への不順守が存在しない。 etc… 個体 1 個体 2 個体 3 互いに無干渉個体処置 X1 処置 X2 ×

条件② 観察研究において 30 SUTVA条件を満たしているだけではまだまだです。実験をせずに因果推論する場合、強く無視できる割り当て条件（Strongly Ignorable Treatment Assignment）を手元にあるデータが満たしている必要があります。すなわち、処置の割当は共変量のみに依存するけれども、結果変数には依存しない、との仮定です。（ややこしいですよね….）
コンセプト具体例共変量 X が同じであれば、処置有・無のそれぞれの結果変数の同時分布(Y1, Y0) と処置変数 X は独立である。白金台出身20代男性IT企業社員（読書が趣味）であれば、転職・非転職時の所得の同時分布と転職するかどうかの意思（確率）は独立である。結果 Y1 結果 Y0 処置 X 共変量 X 転職時所得今の所得転職確率白金台出身… 共変量が同じ集団は、処置の割り当てがランダムに行われたと想定してよい、という仮定（※この仮定はデータ生成プロセスに究極的に依存するため、手元のデータから立証できるものでは無く、実質的に立証不可能。）

エビデンスレベルそのシビアさ 31 医学・疫学など、研究結果が非常にクリティカルに影響してしまう分野において、因果を論証することは非常に大変です。患者データに基づかない、専門委員会や専門家個人の意見記述研究（症例報告やケースシリーズ）分析疫学的研究（症例対照研究、横断研究）分析疫学的研究（コホート研究）非ランダム化比較試験 1つ以上のランダム化比較試験
システマティック・レビュー／ランダム化比較試験のメタアナリシス Ⅱ Ⅲ Ⅳa Ⅳb Ⅴ Ⅵ Ⅰ 高低実験研究観察研究因果関係の立証と見なされうるもの Source : 日経メディカル RCTの無い研究をどこまで積み上げたところで、因果関係の立証とはみなされない

実験研究の難しさたとえ実験が出来たとしても 32 種々考えなければならない問題がございます。被験者が人である以上、心理的側面への強い配慮が必要となります。倫理的妥当性処置の割り当てによる強制が倫理的に許容されるか否か。ホーソン効果通常よりもポジティブ・ネガティブな環境に置かれることにより、被験者の行動が変わってしまうこと。ピグマリオン効果
被験者が研究者の期待に無意識のうちに影響され、研究者の意図に沿うような行動をしてしまうこと。（ローゼンタール効果）コストの高さ被験者を準備するのにかかるコストが莫大。外的妥当性の欠如少数の選抜されたサンプルからなる実験となりやすいため、そこから得られた結果を一般化出来ないこと。ノンコンプライアンス割り当てられた処置を被験者が実行しないこと。

射程できること、できないこと 33 因果推論のための研究手法が種々ある中で、統計的因果推論がその力を最も発揮するのは、観察研究においてです。ただし、強く無視できる割り当て条件が満たされる範囲に限られます。そして往々にして、この条件の立証は不可能です。実験研究処置のランダムな割当が可能観察研究処置のランダムな割当が不可能
研究手法自然実験偶然起きた実験的環境を利用疑似実験疑似的な実験的枠組みを統計的に構築単純な分析手元にあるデータのみで分析（集計・相関・回帰 etc…）〇〇 × 〇因果効果の立証 Yes No 統計的因果推論の諸手法が力を発揮する範囲（シンプソンパラドックス・疑似相関を回避する術はない）手元にあるデータが強く無視できる割り当て条件を満たしているのであれば、疑似実験の手法を用いて、因果推論が可能になる。強く無視できる割り当て条件

コーヒーの健康効果に関する研究 34 最近の記事、ご存知でしたか？ Coffee Break  200以上の観察研究を踏まえると、一日3杯程度のコーヒーは健康に好影響かもしれないという研究結果が出ている。  具体的には、心疾患のリスクの減少
 ただし、観察研究であるゆえ、「コーヒーが健康促進の原因とは限らない」との留保付き。 Source : BBC 非常に抑えられた筆致で、謙虚に結果を報告

3. 評価 35

評価私見もふまえて 36 「因果関係」という不確かなものに対して、統計的因果推論は、数学・確率論・統計学を武器に立ち向かいます。そのフレームワークの明瞭さ・分かりやすさは、因果関係の議論の土台を提供するのに非常に有用でしょう。しかしながら、実務における統計的因果推論の有用性は、限定的だと思われます。ポジティブネガティブ  単純かつ明快なフレームワーク
「観測できない反事実を推定し、比較する」という論理は非常にシンプルかつ明快で非専門家にとっても分かりやすく、また汎用的である  定量的な効果把握のための汎用的な手法の提供因果の有無という抽象的な問いではなく、因果の効果という具体的かつ定量的な問いに対する解法を一般的な形で提供している  アカデミックなレベルでのエビデンスの強さ医学・疫学含め多様なアカデミックの各分野で因果推論の手法として利用されており、推論結果のエビデンスとしての信頼性は非常に高い  立証不可能な仮定に基づく難解な手法各手法の背景となる数理・統計概念が難解で、多くの場合データからは立証不可能な仮定に基づかなければならない  手法の正しさ・良さを巡る問い様々な手法のどれがより正しいのか、より良いのかを決める議論が未成熟であり、手法毎に異なる因果効果が算出され、併存してしまう  適用コストの大きさ一つの原因に対する一つの結果を厳密に論証するスタイルであるため、論証にかかる時間的コストが大きい時間がかかっても、仮説・命題の正しさを一般的な形式で論証することが求められるアカデミックの場では、適用がしやすい仮説を早く・安く・分かりやすく立証し、施策化することが求められるビジネス実務の場では、適用が難しい

Guiding Principles for Evidence-Based Policymaking 37 最近では、行政の世界で、エビデンスに基づいた政策立案（Evidence-Based Policymaking / EBPM
）を進める動きが盛んらしいです。アメリカの連邦議会には、「エビデンスに基づく政策立案委員会 (Commission on Evidence-Based Policymaking / CEM)」があり、行政におけるEBPMを促進しているようです。このCEMが提言しているガイドラインは、分析官の職業規範として意識しておいてよいかもしれません。エビデンスに基づくマーケティング（EBM）に言い換えても、さほどおかしくはないでしょうし。 Source : The Promise of Evidence-Based Policymaking 1. プライバシー 2. 厳密さ 3. 透明性 4. 謙虚さ 5. 有能さ個人のプライバシーを尊重せよ研究デザイン・方法に最新の注意を払えエビデンスはそのプロセスと共に適切に公開されよ過度に一般化することなかれ必要なスキルをもつ人材を集めよエビデンスに基づく政策立案のためのガイドライン（こちらを参考に拙訳）

ビジネスにおける実装統計的因果推論は使えるのか 38 直接的に、手法を適用することは難しいでしょう。考えなければならない点も多々あります。  エビデンスの強さはどこまで求められるのか？緻密な論証が求められる場合もあれば、何か示唆や兆候が得られる程度良いという場合もあり、すべては顧客要望次第だと言ってしまえばその通りです。しかし実際のところ、どこまでのエビデンスレベルであれば、ビジネスの場で有用な知見となりうるのか、疑問です。
厳密な論証でもなく、単純な集計でもない、バランスのとれたポジションはどこにあるのでしょうか？  どの手法が最もコスパが良いか？一口に統計的因果推論と入っても、その箱の中にあるツールは多種多様です。それゆえに分析者は、「結局どの手法を使えばよいのか」という問いに直面せざるを得ません。予測モデルように、何かしらの数理的な基準に基づき、手法の優劣を決定することが出来ない以上（私の知る限り、おそらく、ですが）、エビデンスの強さ、コストの大きさ（主にはコーディング量でしょうか）、非専門家にとっての（そして分析者自身にとっての）分かりやすさなどの複数の観点から、どの手法から適用を考えていくべきか、総合的に考察せざるを得ないように思われますが、本当にそれでよいのでしょうか？  非専門家にどのように推論結果を伝えれば良いのか？統計的因果推論の諸手法は、決して分かりやすいものではありません。しかし一方で、その結果を使って実際に施策の立案をするのは、往々にして非専門家の方々です。彼らが十分に納得し、自身の施策案の論理的根拠として確信し、武装できるようなものを分析者は提出することが望まれますし、またそう説明されることを望まれているはずです。そのようなニーズの中で、厳密さを維持し、過度の一般化を避けつつ、それでも分かりやすく分析結果を伝え、納得していただくには、どうすれば良いのでしょうか？

三行サマリー最後にもう一度 39 長々とお話して参りましたが、お伝えしたいメッセージは3点です。本書の情報が、皆さまの日々のお仕事のほんの小さな糧とでもなれば、幸いです。  因果関係を定量的に捉える一つの枠組みとして、統計的因果推論という方法が注目されています。  この方法の大きな特徴は、原因がある場合と無い場合の結果の差を考える際、実際に観測できなかった方の結果（反事実）を統計的に推定することで、結果の比較を実現する点にあります。
 その論証スタイルの厳密さから、アカデミックな場ではすでに広く使われていますが、ビジネスにおける直接適用は難しいかもしれません。しかしながら、因果を考える際の基本的なフレームワークとしては、ビジネスの場でも非常に有用だと思われます。

レファレンス興味をもってくださった方に 40 本書の情報のほとんどは、複数の書籍・サイト・論文を参照しております。ここでは、特におすすめの二つの情報源をご紹介致します。  入門書としてお勧めの一冊。今更入門書…と思われる方も、ぜひ。  法学分野でミクロ計量経済学のアプローチで研究されている方が、連載で書かれていたものを一冊
にまとめたものです。  入門書ではありますが、分析（特に因果推論）をする上での概念や考え方、お作法の要所をレベルを落とさず語っているように感じます。  読んでて退屈しませんでした。  お勧めのサイトの一つ。  環境リスクの研究者の方のブログです。  分析実務に関わる方へ示唆に富んだ記事を多く執筆されています。  確率・統計の考え方や手法を現実世界に当てはめようとすると何が起きるのか、という点に非常に繊細な注意を払われており、真摯な姿勢を感じます。

本資料の著作権は、第三者に帰属する著作権を除き、本資料を作成した株式会社ブレインパッドに帰属します。当社の許可なく無断で、複製、改変・翻訳、販売等をすることはできません。ただし、本資料の閲覧者は、株式会社ブレインパッドの著作物である旨を表示し、かつ、非営利目的および本資料を改変しない場合に限り、本資料をダウンロード、プリントアウト、またはコピーし、自己のために閲覧・利用することができます。なお、著作権法上認められている範囲内での引用を行うことは可能です。本資料を引用するには、以下の条件を満たす必要がありますので、ご留意ください。 1. 引用先と引用部分に主従関係があること。 2.
引用部分と本文が明確に区別できること。 3. 引用する必然性があり、その範囲についても必然性・合理性があること。 4. 出所を明示すること。 5. 部分的な改変などをせず、原文のまま引用すること。株式会社ブレインパッド〒108-0071 東京都港区白金台3-2-10 白金台ビル TEL：03-6721-7002 FAX：03-6721-7010 www.brainpad.co.jp [email protected] Analytics Innovation Company

「因果関係」をとらえるために / To grasp causal relationship

「因果関係」をとらえるために / To grasp causal relationship

BrainPad

More Decks by BrainPad

Other Decks in Research

Featured

Transcript

「因果関係」をとらえるために統計的因果推論に関する自由研究

目次 3 3本立てでございます。 1.問題意識 2.概念の整理 3.評価

1. 問題意識 5

「相関は因果ではありません」 6 と、統計学の教科書の1ページ目に書いてありました。 Wikipediaにもありました。

統計的因果推論、はじめました。 15 本書はその過程で学んだこと（そして現在進行形で学んでいること）のまとめになります。

2. 概念の整理 16

全体像 17 一口に「統計的因果推論」といっても、この分野を構成する概念・手法は、様々な分野における因果推論の研究の蓄積から成ります。統計的因果推論統計学情報科学経済学社会学

問題への解答 2つの潮流 19 因果関係を議論するにあたって、その定式化を試みたのが、二人のスーパースターです。ルービン因果モデル（Rubin Causal Model / RCM） by

ルービン因果モデル ①問題設定 20 ルービン因果モデル（Rubin Causal Model / RCM）のご紹介にあたり、分かりやすさを重視して、身近な具体例を併記いたします。コンセプト具体例

ルービン因果モデル ④問題の解決方法 23 もう一つの世界を観測できないのならば、その世界を何かしらの方法で構築し、その結果を推察すればよい、のではないでしょうか。コンセプト具体例ある個体 u が、処置 X

統計的因果推論の諸手法と、その整理 26 本書のフォーカスではありませんが、統計的因果推論で頻出する手法は下表のとおりです。数学的詳細は専門書を紐解きください。手法概要仮定分かりやすさ適用しやすさ

ルービン因果モデル ⑦新しい手法マッチング 27 RCTが出来ない環境下での統計的因果推論の一つの手法として、マッチングがあります。コンセプト具体例処置 X を受けた

条件① 最も重要な仮定 29 統計的因果推論に必要な条件の中で、最も重要かつ基本的なものの一つが、SUTVA（Stable Unit Treatment Value Assumption）条件です。 ①相互干渉の排除と、②処置の一意性からなる条件です。コンセプト

3. 評価 35

Guiding Principles for Evidence-Based Policymaking 37 最近では、行政の世界で、エビデンスに基づいた政策立案（Evidence-Based Policymaking / EBPM