Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Exploratory: 線形回帰 Part 2 - 重回帰、係数の解釈、変数重要度

Kan Nishida
August 21, 2019

Exploratory: 線形回帰 Part 2 - 重回帰、係数の解釈、変数重要度

前回の「線形回帰の紹介 - Part 1 基礎編」の続きのセッションです。

今回は、前回で学んだことをさらに発展させ、複数の予測変数があるときに重回帰分析の手法を使って、それぞれの変数の独立した影響度の理解の仕方、またより影響度の大きい予測変数の探し方の話をします。

さらに、線形回帰のモデルを複数作ることで、変数の影響度の違いをグループ毎に見ていく方法も紹介します。

Kan Nishida

August 21, 2019
Tweet

More Decks by Kan Nishida

Other Decks in Science

Transcript

  1. 2 εϐʔΧʔ ੢ా צҰ࿠ CEO EXPLORATORY ུྺ 2016೥ɺσʔλαΠΤϯεͷຽओԽͷͨΊɺExploratory, Inc Λཱͪ

    ্͛Δɻ Exploratory, Inc.ͰCEOΛ຿ΊΔ͔ͨΘΒɺσʔλαΠΤϯεɾϒʔ τΩϟϯϓɾτϨʔχϯάͳͲΛ௨ͯ͠γϦίϯόϨʔͰߦΘΕ͍ͯ Δ࠷ઌ୺ͷσʔλαΠΤϯεͷීٴͱڭҭʹऔΓ૊Ήɻ ถΦϥΫϧຊࣾͰɺ16೥ʹΘͨΓσʔλαΠΤϯεͷ։ൃνʔϜΛ཰ ͍ɺػցֶशɺϏοάɾσʔλɺϏδωεɾΠϯςϦδΣϯεɺσʔ λϕʔεʹؔ͢Δ਺ଟ͘ͷ੡඼ΛੈʹૹΓग़ͨ͠ɻ @KanAugust
  2. ୈ1ͷ೾ ୈ̎ͷ೾ ୈ̏ͷ೾ ϓϥΠϕʔτ(ߴ͍/ݹ͍) Φʔϓϯɾιʔε(ແྉ/࠷ઌ୺) UI & ϓϩάϥϛϯά ϓϩάϥϛϯά 2016

    2000 1976 ϚωλΠθʔγϣϯ ίϞσΟςΟԽ ຽओԽ ౷ܭֶऀ σʔλαΠΤϯςΟετ Exploratory ΞϧΰϦζϜ Ϣʔβʔɾ ମݧ πʔϧ Φʔϓϯɾιʔε(ແྉ/࠷ઌ୺) UI & ࣗಈԽ ϏδωεɾϢʔβʔ ςʔϚ σʔλαΠΤϯεͷຽओԽ
  3. 16 500ສ ۈଓ೥਺ 40೥ 20೥ 10೥ ೖࣾ 30೥ څྉ 1000ສ

    1500ສ 2000ສ ֤఺͔Βͷڑ཭͕࠷খʹͳΔ Α͏ͳ௚ઢΛҾ͘ɻ
  4. 17 500ສ ۈଓ೥਺ 40೥ 20೥ 10೥ ೖࣾ 30೥ څྉ 1000ສ

    1500ສ 2000ສ څྉ = 50ສ * ۈଓ೥਺ + 500ສ
  5. ༧ଌର৅஋ ( y ) ΛɺҰͭͷ஋ ( x ) ͔Β༧ଌ͢Δ৔߹ y

    = a * x + b څྉ = 50ສ * ۈଓ೥਺ + 500ສ
  6. څྉ = 500 * ۈଓ೥਺ + 600 * ৬Ґ +

    5000 ۈଓ೥਺͕̍೥૿͑Δͱڅྉ͕$500૿͑Δ͜ͱ͕ظ଴͞ΕΔɺ ৬Ґ͕มΘΒͳ͔ͬͨΒɻ ॏճؼʢMultiple Linear Regressionʣ
  7. 6100 = 500 * 1 + 600 * 1 +

    5000 ۈଓ೥਺: 1 ৬Ґ: 1 ΋͠ɺ͜ͷձࣾͰ1೥ಇ͍ͨΒɻɻɻ څྉ = 500 * ۈଓ೥਺ + 600 * ৬Ґ + 5000
  8. 6600 = 500 * 2 + 600 * 1 +

    5000 څྉ = 500 * ۈଓ೥਺ + 600 * ৬Ґ + 5000 ۈଓ೥਺: 2 ৬Ґ: 1 ΋͠ɺ2೥ಇ͍ͨΒɺ͔͠͠৬Ґ͸ͦͷ··ɻɻɻ
  9. 6600 = 500 * 2 + 600 * 1 +

    5000 6100 = 500 * 1 + 600 * 1 + 5000 1 ೥ 2 ೥ 6600 6100 $500 ૿Ճ! ۈଓ೥਺: 2 ۈଓ೥਺: 1
  10. 6600 = 500 * 2 + 600 * 1 +

    5000 6100 = 500 * 1 + 600 * 1 + 5000 1 ೥ 2 ೥ 6600 6100 $500 ૿Ճ! ۈଓ೥਺: 2 ۈଓ೥਺: 1 ͜ͷ૿Ճ෼͸ۈଓ೥਺ͷ܎਺Ͱ͋Δ
  11. 6,100 6,600 1 ೥ 2 ೥ څྉ = 500 *

    ۈଓ೥਺ + 600 * ৬Ґ + 5000
  12. څྉ = 46 * ۈଓ೥਺ + 3788 * ৬Ґ +

    1835 ۈଓ೥਺͕̍೥૿͑Δͱڅྉ͕$46૿͑Δ͜ͱ͕ظ଴͞ΕΔɺ ৬Ґ͕มΘΒͳ͔ͬͨΒɻ
  13. څྉ = 46 * ۈଓ೥਺ + 3788 * ৬Ґ +

    1835 ৬Ґ͕1Ϩϕϧ্͕Δͱɺڅྉ͕$3788૿͑Δ͜ͱ͕ظ଴͞ΕΔɺ ۈଓ೥਺͕มΘΒͳ͔ͬͨΒɻ
  14. 98 Last Variable ͦΕͧΕͷม਺͸R2৐஋ʹͲΕ͚ͩߩݙ͢Δ͔ʁ A + B + C B

    + C - 0.9 - 0.1 = 0.8 A + B + C A + C - A + B + C A + B - 0.9 - 0.7 = 0.2 0.9 - 0.8 = 0.1 ߩݙ౓ ϕʔεϥΠϯͱͳΔϞσϧ ม਺Λؚ·ͳ͍
  15. 99 Lindeman Merenda Gold A B + A 0.8 B

    + C + A 0.7 0.75 0.75 0.75 ฏۉ B ͦΕͧΕͷม਺͸R2৐஋ΛͲΕ্͚ͩ͛Δ͜ͱ͕Ͱ͖Δͷ͔ʁ C + A C B + C Without A With A R2৐ Aͷॏཁ౓ - - -
  16. 120