Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Lordのパラドックス

 Lordのパラドックス

D731ae44245b80c37b59d588287aacd7?s=128

Masafumi Abeta

August 27, 2021
Tweet

Transcript

  1. XX University Lordのパラドクス 2021.08.26 Abeta

  2. 2 どちらの統計家が正しい? ある全寮制の学校にて、学⽣たちは学年の初めにミールプランAとミールプランBを選ぶ。そして年初と年末 に体重を計測した。ミールプランが体重に与える影響について調べたい。計測値はグラフのようになった。 データ分析を⼆⼈の統計家に依頼したところ次の返事が返ってきた。 統計家1:𝑊! − 𝑊" を集計するとゼロになるので、ミールプランA or

    Bで体重への影響はない。 統計家2:年初の体重が𝑤# の学⽣はミールプランBの⽅が体重が増加しており、体重への影響がある。 (⾮現実的だが思考問題のために、𝑤# の値に依存しないと仮定する) 𝑊" 𝑊! B A 𝑊! = 𝑊" 𝑤#
  3. 3 数式で考えよう 統計家1が計算しているもの。 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤#

    , 𝑋 = 𝑎 − 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑏 𝐸 𝑊! − 𝑊" = 0 統計家2が計算しているもの。 ∵グラフから
  4. 4 因果モデル 𝑌 = 𝑊! − 𝑊" 、 𝑋をミールプランを表す確率変数と定義して、因果モデルを考える。 ⼊寮後にミールプランを選ぶので、時系列を考えると初期体重がミールプランの選択に影響を及ぼす可能性が

    ある。 𝑊, 𝑊- 𝑋 𝑌 +1 −1
  5. 5 統計家1を深堀りしてみる ミールプランの違いを考慮していないので、ミールプランごとに計算してみよう。 𝐸 𝑊! − 𝑊" do 𝑋 =

    𝑎 − 𝐸[𝑊! − 𝑊" |do(𝑋 = 𝑏)] グラフから同時分布を求め、条件付き分布を求める。 𝑃 𝑌 do 𝑋 = 𝑥 = 𝑃! 𝑌 𝑋 = 𝑥 = ( ","$ 𝑃!(𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤′|𝑋 = 𝑥) = ( ","$ 𝑃! 𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤$ 𝑃! 𝑊& = 𝑤$ 𝑃!(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) = ( ","$ 𝑃 𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤$ 𝑃 𝑊& = 𝑤$ 𝑃(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) ⇒ 𝐸 𝑌 do 𝑋 = 𝑥 = ( ","$ 𝐸 𝑌, 𝑊% = 𝑤, 𝑊& = 𝑤$ 𝑃 𝑊& = 𝑤$ 𝑃(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) = ( ","$ (𝑤 − 𝑤′)𝑃 𝑊& = 𝑤$ 𝑃(𝑊% = 𝑤|𝑊& = 𝑤$, 𝑋 = 𝑥) !! !" ! = # " +1 −1 !! !" # " +1 −1 do
  6. 6 ミールプランの効果 𝐸 𝑌 do 𝑋 = 𝑎 = (

    !,!# (𝑤 − 𝑤′)𝑃 𝑊$ = 𝑤# 𝑃(𝑊% = 𝑤|𝑊$ = 𝑤#, 𝑋 = 𝑎) = ( !,!# 𝑤𝑃(𝑊% = 𝑤|𝑊$ = 𝑤#, 𝑋 = 𝑎) 𝑃 𝑊$ = 𝑤# − ( !! 𝑤#𝑃 𝑊$ = 𝑤# = ( !# 𝐸(𝑊% |𝑊$ = 𝑤#, 𝑋 = 𝑎) 𝑃 𝑊$ = 𝑤# − 𝐸 𝑊$ = ( !# (𝜇% & − 𝜌& 𝜎% & 𝜎$ & 𝑤# − 𝜇$ & )𝑃 𝑊$ = 𝑤# − 𝜇$ = 𝜇% & − 𝜌& 𝜎% & 𝜎$ & 𝜇$ − 𝜇$ & − 𝜇$ = (𝜇% &−𝜇$ ) 1 + 𝜌& 𝜎% & 𝜎$ & < 0 𝑃 𝑌 do 𝑋 = 𝑎 − 𝑃 𝑌 do 𝑋 = 𝑏 = (𝜇% &−𝜇$ ) 1 + 𝜌& 𝜎% & 𝜎$ & − (𝜇% '−𝜇$ ) 1 + 𝜌' 𝜎% ' 𝜎$ ' (< 0) = 𝜇% & 1 + 𝜌& 𝜎% & 𝜎$ & − 𝜇% ' 1 + 𝜌' 𝜎% ' 𝜎$ ' − 𝜇$ (𝜌& 𝜎% & 𝜎$ & − 𝜌' 𝜎% ' 𝜎$ ' ) = 1 + 𝜌 𝜇% & − 𝜇% ' ∵これ以上計算できないのでガウス分布を仮定する ∵分散と相関が同じだと仮定しちゃおう! ∵グラフより !! !" B A !" = !! ## 𝑃 𝑌 do 𝑋 = 𝑏 = (𝜇% '−𝜇$ ) 1 + 𝜌' 𝜎% ' 𝜎$ ' > 0
  7. 7 統計家2を深堀りしてみよう 統計家2が計算したかったであろうもの。 𝐸 𝑊! − 𝑊" do 𝑋 =

    𝑎, 𝑊" = 𝑤# − 𝐸[𝑊! − 𝑊" |do(𝑋 = 𝑏, 𝑊" = 𝑤# )] 𝑊$ = 𝑤( 𝑊- 𝑋 = 𝑥 𝑌 +1 −1 これで計算できるのは、ミールプランが𝑌に与える「制御された直接効果」である。 𝑊, 𝑊- 𝑋 𝑌 +1 −1 do
  8. 8 制御された直接効果を計算しよう (1/2) !! = #" !! $ = %

    " +1 −1 !% !! # " +1 −1 do 𝑃 𝑌 do 𝑋 = 𝑥, 𝑊" = 𝑤# = 𝑃$ 𝑌 𝑋 = 𝑥, 𝑊" = 𝑤# 定義から、 𝑃$ 𝑌, 𝑋, 𝑊" , 𝑊! = 𝑃$ 𝑌 𝑊" , 𝑊! 𝑃$ 𝑊" 𝑃$ 𝑊! 𝑊" , 𝑋 𝑃$ 𝑋 ⇒ 𝑃$ 𝑌, 𝑋, 𝑊" = : % 𝑃$ 𝑌 𝑊" , 𝑊! = 𝑤 𝑃$ 𝑊" 𝑃$ 𝑊! = 𝑤 𝑊" , 𝑋 𝑃$ 𝑋 ⇒ 𝑃$ 𝑌|𝑋, 𝑊" = : % 𝑃$ 𝑌 𝑊" , 𝑊! = 𝑤 𝑃$ 𝑊" 𝑃$ 𝑊! = 𝑤 𝑊" , 𝑋 𝑃$ 𝑋 /𝑃$ (𝑋, 𝑊" ) = : % 𝑃$ 𝑌 𝑊" , 𝑊! = 𝑤 𝑃$ 𝑊! = 𝑤 𝑊" , 𝑋 = : % 𝑃 𝑌 𝑊" , 𝑊! = 𝑤 𝑃 𝑊! = 𝑤 𝑊" , 𝑋 グラフから同時分布を求め、条件付き分布を求める。
  9. 9 制御された直接効果を計算しよう (2/2) 𝐸 𝑌 do 𝑋 = 𝑎, 𝑊&

    = 𝑤' = ( " 𝐸 𝑌 𝑊& = 𝑤' , 𝑊% = 𝑤 𝑃 𝑊% = 𝑤 𝑊& = 𝑤' , 𝑋 = 𝑎 = ( " (𝑤 − 𝑤')𝑃 𝑊% = 𝑤 𝑊& = 𝑤', 𝑋 = 𝑎 = ( " 𝑤𝑃 𝑊% = 𝑤 𝑊& = 𝑤' , 𝑋 = 𝑎 − 𝑤' = 𝐸 𝑊% 𝑊& = 𝑤' , 𝑋 = 𝑎 − 𝑤' = 𝜇% ( − 𝜌( 𝜎% ( 𝜎& ( 𝑤' − 𝜇& ( − 𝑤' 𝐸 𝑌 do 𝑋 = 𝑎, 𝑊& = 𝑤' − 𝐸 𝑌 do 𝑋 = 𝑏, 𝑊& = 𝑤' = 𝜇% ( − 𝜇% ) − 𝜌( 𝜎% ( 𝜎& ( 𝑤' − 𝜇& ( + 𝜌) 𝜎% ) 𝜎& ) 𝑤' − 𝜇& ) (< 0) = 𝜇% ( 1 + 𝜌( 𝜎% ( 𝜎& ( − 𝜇% ) 1 + 𝜌) 𝜎% ) 𝜎& ) − 𝑤'(𝜌( 𝜎% ( 𝜎& ( − 𝜌) 𝜎% ) 𝜎& ) ) = (1 + 𝜌)(𝜇% ( − 𝜇% )) ∵これ以上計算できないのでガウス分布を仮定する ∵分散と相関が同じだと仮定しちゃおう! !! = #" !! $ = % " +1 −1 !% !! # " +1 −1 do ∵グラフより 統計家2の計算したものに⼀致する。 !! !" B A !" = !! ##
  10. 10 ちなみに 先に求めたものは、 𝑊" = 𝑤# の期待値をとったものになっている。 𝑃 𝑌 do

    𝑋 = 𝑥 = : % 𝑃 𝑌 do 𝑋 = 𝑎 , 𝑊" = 𝑤 𝑃(𝑊" = 𝑤|do(𝑋 = 𝑥)) = : % 𝑃 𝑌 do 𝑋 = 𝑎 , do(𝑊" = 𝑤) 𝑃(𝑊" = 𝑤|do(𝑋 = 𝑥)) = : % 𝑃 𝑌 do 𝑋 = 𝑎 , do(𝑊" = 𝑤) 𝑃(𝑊" = 𝑤) ∵ 𝑊" をdoオペレーションしてもグラフが変わらない(次ページで補⾜) ∵因果モデルから𝑊" がdo(𝑋)よりも先に起こる(do条件の時使える式変形) 𝐸 𝑌 do 𝑋 = 𝑎, 𝑊" = 𝑤# = 𝜇! & − 𝜌& 𝜎! & 𝜎" & 𝑤# − 𝜇" & − 𝑤# 𝐸 𝑌 do 𝑋 = 𝑎 = 𝜇! & − 𝜌& 𝜎! & 𝜎" & 𝜇" − 𝜇" & − 𝜇" 統計家2のものと⽐較すると、𝑤# が𝜇" になっている。
  11. 11 補⾜ 𝑃 𝑌, 𝑊" do 𝑋 = 𝑥 =

    𝑃 𝑌 do 𝑋 = 𝑥 , 𝑊" 𝑃 𝑊" do 𝑋 = 𝑥 = 𝑃 𝑌 do 𝑋 = 𝑥 , 𝑊" 𝑃(𝑊" ) 𝑃 𝑌, 𝑊" do 𝑋 = 𝑥 = 𝑃$ 𝑌, 𝑊" 𝑋 = 𝑥 = : % 𝑃$ (𝑌, 𝑊! = 𝑤, 𝑊" |𝑋 = 𝑥) = : % 𝑃$ 𝑌, 𝑊! = 𝑤, 𝑊" 𝑃$ 𝑊" 𝑃$ (𝑊! = 𝑤|𝑊" , 𝑋 = 𝑥) = : % 𝑃 𝑌, 𝑊! = 𝑤, 𝑊" 𝑃 𝑊" 𝑃 (𝑊! = 𝑤|𝑊" , 𝑋 = 𝑥) 𝑃 𝑌 do 𝑋 = 𝑥 , 𝑊" = 𝑤# = : % 𝑃 𝑌, 𝑊! = 𝑤, 𝑊" = 𝑤# 𝑃 (𝑊! = 𝑤|𝑊" = 𝑤# , 𝑋 = 𝑥) = 𝑃 𝑌 do 𝑋 = 𝑥, 𝑊" = 𝑤#
  12. 12 どちらが正しいのか 全員の体重を等しくした状態で、全員にミールプランAを⾷べさせた場合と全員にミールプランBを⾷べさせ た場合を⽐較する統計家2の⽅が正しい。 全員ミールプランA 全員ミールプランB 体重が同じ⼈達 ⽐較

  13. 13 解釈 体重が重い⼈の体重をキープできる定⾷Bは、体重が軽い⼈の体重をキープできる定⾷Aよりもカロリーが多 いはず! むしろ体重が変わらないことこそが、定⾷Bの体重増加効果を表している。 !! !" B A !"

    = !! ## ⼒⼠の ちゃんこ鍋定⾷ ダイエット定⾷
  14. 14 平均への回帰? 体重が同じ⼈を集め、ダイエット定⾷Aとちゃんこ定⾷Bを⾷べさせると、Aを⾷べている⼈はダイエッターの 平均値に近づいていき、Bを⾷べている⼈は⼒⼠の平均に近づいていく。 𝑊" 𝑊! B A 𝑊! =

    𝑊" 𝑤# 𝑤# ⼒⼠の平均へ ダイエッター の平均へ ここ怪しいので有識者はコメント下さい
  15. 15 統計家1との違い 𝐸 𝑊! − 𝑊" = : %,( 𝐸

    𝑊! − 𝑊" |𝑊" = 𝑤, 𝑋 = 𝑥 𝑃(𝑊" = 𝑤, 𝑋 = 𝑥) = : % 𝐸 𝑊! − 𝑊" |𝑊" = 𝑤, 𝑋 = 𝑎 𝑃 𝑊" = 𝑤|𝑋 = 𝑎 𝑃(𝑋 = 𝑎) + 𝐸 𝑊! − 𝑊" |𝑊" = 𝑤, 𝑋 = 𝑏 𝑃 𝑊" = 𝑤 𝑋 = 𝑏 𝑃(𝑋 = 𝑏) 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑎 − 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑏 ←統計家2 基準がミールプランAの平均 基準がミールプランBの平均 ブラン内差の和 ブラン間の差 𝑊" 𝑊! B A 𝑊! = 𝑊" 𝜇" & 𝜇" ) 𝜇! ) 𝜇! & ←各ミールプランのグループでは体重変化はないのに、 全体で考えるとミールプランによる体重変化への影響が 現れるのはシンプソンのパラドックスに相当する。
  16. 別バリエーション

  17. 17 Lordが提⽰した元々のバリエーション ある全寮制の学校にて、年初と年末に体重を計測した。性別が体重に与える影響について調べたい。計測値は グラフのようになった。データ分析を⼆⼈の統計家に依頼したところ次の返事が返ってきた。 統計家1:𝑊! − 𝑊" を集計するとゼロになるので、性別で体重への影響はない。 統計家2:年初の体重が𝑤# の学⽣は男性の⽅が体重が増加しており、体重への影響がある。

    (⾮現実的だが思考問題のために、𝑤# の値に依存しないと仮定する) 𝑊" 𝑊! m f 𝑊! = 𝑊" 𝑤#
  18. 18 因果モデル 𝑌 = 𝑊! − 𝑊" 、 𝑋を性別を表す確率変数と定義して、因果モデルを考える。 時系列を考えると性別が初期体重に影響を及ぼす可能性がある。

    𝑊, 𝑊- 𝑋 𝑌 +1 −1
  19. 19 数式で考えよう 統計家1が計算しているもの。 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤#

    , 𝑋 = 𝑚 − 𝐸 𝑊! − 𝑊" 𝑊" = 𝑤# , 𝑋 = 𝑓 > 0 𝐸 𝑊! − 𝑊" = 0 ∵グラフから 統計家2が計算しているもの。 𝐸 𝑊! − 𝑊" |do(𝑋 = 𝑚) − 𝐸 𝑊! − 𝑊" |do(𝑋 = 𝑓) = 𝐸 𝑊! − 𝑊" |𝑋 = 𝑚 − 𝐸 𝑊! − 𝑊" |𝑋 = 𝑓 = 0 ∵グラフから 統計家1に性別を考慮したものもゼロになる。 各項は𝑊! の期待値を取ればゼロになることに注意。
  20. 20 統計家2を深堀りする 統計家2の計算を制御された直接効果に変更する。 𝐸 𝑊% − 𝑊& do(𝑊& = 𝑤',

    𝑋 = 𝑥) ( " 𝐸 𝑌, 𝑊% = 𝑤 do(𝑊& = 𝑤', 𝑋 = 𝑥) = ( " 𝐸! 𝑌 𝑊& = 𝑤', 𝑊% = 𝑤 𝑃!(𝑊%|𝑊& = 𝑤', 𝑋 = 𝑥) = ( " 𝐸 𝑌 𝑊& = 𝑤' , 𝑊% = 𝑤 𝑃(𝑊% |𝑊& = 𝑤' , 𝑋 = 𝑥) = ( " (𝑤 − 𝑤' )𝑃(𝑊% |𝑊& = 𝑤' , 𝑋 = 𝑥) = 𝐸 𝑊% − 𝑊& 𝑊& = 𝑤' , 𝑋 = 𝑚 = 𝜇% + − 𝜌+ 𝜎% + 𝜎& + 𝑤' − 𝜇& + − w' 𝐸 𝑊% − 𝑊& 𝑊& = 𝑤' , 𝑋 = 𝑚 − 𝐸 𝑊% − 𝑊& 𝑊& = 𝑤' , 𝑋 = 𝑓 = 𝜇% ! − 𝜌! 𝜎% ! 𝜎& ! 𝑤' − 𝜇& ! − w' − 𝜇% , + 𝜌, 𝜎% , 𝜎& , 𝑤' − 𝜇& , + w' = 𝜇% ! − 𝜇% , − 𝜌! 𝜎% ! 𝜎& ! 𝑤' − 𝜇& ! + 𝜌, 𝜎% , 𝜎& , 𝑤' − 𝜇& , ←統計家2と⼀致 !! !" " # +1 −1 !! !" " # +1 −1 do ∵ガウス分布を仮定
  21. 21 パラドックスの解消 統計家1ʻが集計したものは総合効果であり、統計家2が集計したものは制御された直接効果である。 数はモデルが線形の場合の因果効果を表している。 𝑊, 𝑊- 𝑋 𝑌 +1 −1

    𝑏 = 𝜇! $ − 𝜇! * − 𝜌$ 𝜎! $ 𝜎" $ 𝑤# − 𝜇" $ + 𝜌* 𝜎! * 𝜎 " * 𝑤# − 𝜇" * 𝑎 = 𝜇" $ − 𝜇" * Direct Effect: 𝑏 > 0 Total Effect: 𝑏 − 𝑎 + 𝑎𝑐 = 0 ←統計家2 ←統計家1ʼ 𝑐
  22. 22 参考⽂献 • J. Pearl 他著/落海浩 訳,『⼊⾨統計的因果推論』, 朝倉書店, 2019年09⽉01⽇ •

    Pearl, Judea. "Lordʼs Paradox Revisited ‒ (Oh Lord! Kumbaya!): " Journal of Causal Inference, vol. 4, no. 2, 2016, pp. 20160021. https://doi.org/10.1515/jci-2016-0021