もしコロナが無かったとしたら、去年の12⽉のタクシー実⾞数はどの程度になるだろうか? n アプリのUIを変更したが、ユーザのクリック率は向上しただろうか? n サーバーのマッチングロジックを変更したが、ユーザのキャンセル率は減少しただろうか? n クーポンを配ったが、ユーザの実⾞率は向上しただろうか? 問いはシンプルだが、回答に困るビジネス課題を因果推論で解決する
統計的因果推論において因果グラフは必須では無いが、因果構造の定性的な理解とグラフ理論の操作による同時分布の因数分解などに役⽴つ ※ 因果グラフがDAG(Directed Acyclic Graph)であることを前提とした場合の理論が発展している X Y Yの値を決定する関数にXが使われているとき、XはYの直接原因であるといい、 変数Xのノードから変数Yのノードへ⽮印を引いて表す X Y XがYの原因の直接原因であるとき、XはYの原因であるという 変数同⼠の独⽴は因果関係が無いことを意味し、従属であれば因果関係か相関関係がある 左図の分岐経路で、ZとYはおそらく従属であり、相関関係はあるが因果関係は無い Yが変化したとすると直接原因であるXも変化しているはずで、Xの変化はZに変化をもたらすた めおそらく従属である 因果グラフ上で従属関係が存在する経路をパスといい、この場合Z↔X↔Yにパスがあるという Z Y X 直接原因 原因 因果関係 とパス
機械学習モデルをそのまま適⽤すると説明変数間の関係を考慮しないので、原因と考える変数の重要 度は因果効果と⼀致しない T X1 X2 X3 Y 機械学習のイメージ T X1 X2 X3 Y 因果推論のイメージ n 機械学習と因果推論って別物? n 推定時に⾼次元な共変量に対応するため、Causal ForestやDouble Machine Learningなど機械学習と 因果推論の融合が進んでいます n 因果推論も万能のツールではないので、タスクによって使い分ける必要 n どういう場⾯で因果推論使うの? n ビジネス意思決定において操作したい変数は少ない n 操作したい変数と結果変数に着⽬して、操作した場合にどうなるか?という 原因と結果のフレームワークはビジネスの現場で⾮常に役に⽴つ
クロス集計で失敗する例として「シンプソンのパラドクス」を説明 n 因果関係を記述する⽅法として「因果グラフ」を説明 n 「因果グラフ」と「ポテンシャルアウトカム」の2通りの考えで因果効果が求められることを説明 n 機械学習と因果推論の違い n ビジネスの意思決定に因果推論が役⽴つ n 因果効果は機械学習の単純適⽤では求まらない n 因果推論の推定で機械学習が活躍