Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[Gunosy研究会]データ解析のための統計モデリング6章(前篇)

ysekky
September 29, 2014

 [Gunosy研究会]データ解析のための統計モデリング6章(前篇)

ysekky

September 29, 2014
Tweet

More Decks by ysekky

Other Decks in Research

Transcript

  1. 本章でやること •  さまざまなGLMを取り扱う   – 確率分布・リンク関数・線形予測子を組み合わせ る   •  ロジステック回帰  

    •  ポアソン回帰(次回)   •  正規分布、ガンマ分布(次回)   – 交互作用項   – オフセット項(次回)  
  2. GLMのよく使われる組み合わせ 分布 リンク関数 特性 二項分布 logit 離散・上限あり ポアソン分布 log 離散・上限なし

    ガンマ分布 log(正準リンク関数はinverseだが 使いにくい) 連続値・ゼロ以上 正規分布 indenGty 連続値
  3. 例題:  上限のあるカウントデータ •  ある架空植物の個体iそれぞれにおいて   – Ni個の観察種子の打ち生きているのはyi個   •  Niはどの個体でも8個  

    •  全部で100個の個体を調べる   – 個体サイズ:  xi   – 肥料を与えたかどうか:  fi     •  与えていたらfi=T,  与えていなければfi=C
  4. パラメータ推定 •  尤度関数   •  最尤推定する   – R   • 

    glm(cbind(y,  N-­‐y)~  x+f,  data=d,  family=binomial)   – 同様にAICでモデル選択可能  
  5. 交互作用項 •  交互作用項   –  例題:  x_iとf_iの積   –  R

      •  glm(cbind(y,  N-­‐y)~  x*f,  data=d,  family=binomial)   –  x*fはx+y+x:fを省略している   •  むやみに入れないほうが良い   –  交互作用項をいれてAICが改善しても、過大評価して いることが多い   –  個体差・場所差によるばらつきの影響の可能性が高 い   •  7章以降で説明するモデルを使えば、交互作用項の見かけ 上の影響は消える