- 真のモデル: Y
i
= 40 + 0.25X
i
+ 20D
i
+ u
i
の場合
- Y
i
: 学生iの後期試験の得点(目的変数)
- X
i
: 学生iの前期試験の得点(交絡因子)
- D
i
: 学生iの特講受講ダミー(D=1であれば受講)
- u
i
: 誤差項(N(0, σ2)に従う)
- このとき、特講の効果は一律で20点
回帰分析(設定1)
回帰分析(設定2)
- 現実的には、同じ20点でも
- 50点から70点に上げる
- 70点から90点に上げる
難易度は異なる。
- 真のモデル: Y
i
= 40 + 0.25X
i
+ ρ(X
i
)D
i
+ u
i
となる
- 処置変数D
i
の係数がX
i
に依存する
→ 次のスライドでもう少し詳しく設定
Slide 17
Slide 17 text
回帰分析(ρ(X
i
)の設定)
ρ(X
i
)は特講の効果を表し、
下表のような(非線形の)値を取る。
X
i
~50 50~60 60~70 70~80 80~
ρ(X
i
) 25 20 15 10 5
Slide 18
Slide 18 text
回帰分析(データの作成)
左: Pythonコード、右: 出力結果(説明は割愛)
Slide 19
Slide 19 text
回帰分析(sklearnによる実装)
ρ(X
i
) = 24.5,,,となり、
Y
i
= a + bX
i
+ 24.5D
i
+ u
i
というモデルが得られる。
→ 回帰分析では平均的な効果
しか算出できず、非線形な個別
の効果を推定できない