Upgrade to Pro — share decks privately, control downloads, hide ads and more …

はじめての機械学習 / Entrance to Machine Learning

はじめての機械学習 / Entrance to Machine Learning

松村優哉

April 17, 2021
Tweet

More Decks by 松村優哉

Other Decks in Programming

Transcript

  1. ୭ʁ • 名前: 松村優哉 • 学⽣時代の専⾨: 計量経済学、 ベイズ統計、因果推論、マーケティング (研究室のAWSの管理とかもやってた) •

    ⾔語: R, Python • HR系企業でデータサイエンティストしてます • Tokyo.R 運営(初⼼者セッション等) @y__mattu ymattu 2
  2. એ఻ • Ӊ஦ຊ͜ͱʰ3ϢʔβͷͨΊͷ34UVEJP<࣮ફ>ೖ໳ʱ 3 ୈষ 3TUVEJPͷجૅ ୈষ εΫϨΠϐϯάʹΑΔσʔλऩू ୈষ EQMZSUJEZSʹΑΔσʔλલॲཧ

    ୈষ HHQMPUʹΑΔσʔλՄࢹԽ ୈষ 3.BSLEPXOʹΑΔσʔλՄࢹԽ  վగୈ൛ൃചܾఆʂʂʂ ओͳมߋ఺ • ࠷৽ͷ34UVEJP ֤छύοέʔδʹରԠ • จࣈྻૢ࡞ʢTUSJOHSʣ΍೔෇ૢ࡞ʢMVCSJEBUFʣʹؔ͢Δ෇࿥
  3. ͜ͷࢿྉͷର৅ɾ໨త ର৅ • ʮػցֶशʯͱ͍͏ݴ༿ΛॳΊͯฉ͘ • ͜Ε͔Βσʔλ෼ੳΛษڧ͢Δ ໨త • ʮػցֶशͬͯ݁ہԿΛ΍ͬͯΔͷʁʯΛͬ͘͟Γཧղ͢Δ •

    ʮػցֶश ೉͍͠ʯPSʮػցֶशͬͯ"*ͰΊͬͪΌ͍͢͝ʯͱ͍͏Π ϝʔδͷ෷১ • ͜Ε͔Βษڧ͢Δͱ͖ͷ͓࣋ͬͯ͘ͱ͍͍ΠϝʔδΛ਎ʹ͚ͭΔ • Α͘ग़ͯ͘ΔΩʔϫʔυͷཧղ ࿩͞ͳ͍͜ͱ • ਺ࣜʹΑΔղઆ 5
  4. ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 10 • ڭࢣ͋Γֶश • աڈͷσʔλͷதʹϥϕϧ͕͋Δ • Ϟσϧͷத਎͸ɺϥϕϧΛ༧ଌ͢ΔͨΊͷϧʔϧ ୀ৬ 1

    0 0 1 ࢒ۀ ࣌ؒ ೥ྸ څ༩ ɾɾɾ ໨తม਺ ैଐม਺ આ໌ม਺ ಠཱม਺ ༧ଌม਺ ಛ௃ྔ
  5. 12 ୀ৬ 1 0 0 1 ࢒ۀ ࣌ؒ ೥ྸ څ༩

    ɾɾɾ アルゴリズム モデル ୀ৬ ︖ ︖ ︖ ︖ ࢒ۀ ࣌ؒ ೥ྸ څ༩ ɾɾɾ ୀ৬ 0 0 1 1 ࢒ۀ ࣌ؒ ೥ྸ څ༩ ɾɾɾ ༧ଌ
  6. ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 13 • ڭࢣͳֶ͠श • աڈͷσʔλͷதʹϥϕϧ͕ͳ͍ • Ϟσϧͷத਎͸ɺάϧʔϓ෼͚ͷϧʔϧ • ϥϕϧ͸ɺ෼͚ΒΕͨ݁ՌΛݟͯਓ͕͚ͭΔ

    ࢒ۀ ࣌ؒ ೥ྸ څ༩ ɾɾɾ આ໌ม਺ ಠཱม਺ ༧ଌม਺ ಛ௃ྔ ࢒ۀɾଟ څ༩ɾଟ ࢒ۀɾগ څ༩ɾଟ
  7. ෼ྨͱճؼ 17 • ෼ྨ • ໨తม਺͕ΧςΰϦʔ • ճؼ • ໨తม਺͕਺஋

    ࣙΊΔʁࣙΊͳ͍ʁ ݘʁೣʁϥΠΦϯʁ དྷظͷड஫਺͸ʁ དྷళ਺͸ʁ גՁ͸ʁ ೋ஋෼ྨ ଟ஋෼ྨɾଟΫϥε෼ྨ
  8. ѻ͏σʔλ 24 • ペンギンデータ JOTUBMMQBDLBHFT QBMNFSQFOHVJOT MJCSBSZ QBMNFSQFOHVJOT  EBUB

    QBDLBHFQBMNFSQFOHVJOT` IFBE QFOHVJOT  "UJCCMFY TQFDJFTJTMBOECJMM@MFOHUI@NN CJMM@EFQUI@NN GMJQQFS@MFOHUI@ʜCPEZ@NBTT@H TFY GDUGDUECMECMJOUJOUGDU "EFMJF5PSHFʜNBMF "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜ/"/"/"/"/" "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜNBMF ʜXJUINPSFWBSJBCMFZFBSJOU EBU  QFOHVJOT EQMZSGJMUFS JTOB TFY TFY͕ܽଛͷྻΛআ֎
  9. ܾఆ໦Ϟσϧ 25 σʔλΛ෼ׂ JEY  TBNQMF OSPX EBU OSPX EBU

      EBUBUSBJO  EBU<JEY > EBUBUFTU  EBU<JEY > NPEFMEU  QBSUZLJUDUSFF TQFDJFTd EBUBEBUBUSBJO QMPU NPEFMEU UZQFTJNQMF
  10. ϥϯμϜϑΥϨετ 27 NPEFMSG  SBOHFSSBOHFS TQFDJFTd EBUBEBUBUSBJO NUSZ  OVNUSFFT

    SFTVMUSG  QSFEJDU NPEFMEU EBUBUFTU DNSG  DBSFUDPOGVTJPO.BUSJY SFTVMUSG EBUBUFTUTQFDJFT $POGVTJPO.BUSJYBOE4UBUJTUJDT  3FGFSFODF 1SFEJDUJPO"EFMJF$IJOTUSBQ(FOUPP "EFMJF $IJOTUSBQ (FOUPP  0WFSBMM4UBUJTUJDT  "DDVSBDZ $*   /P*OGPSNBUJPO3BUF 17BMVF<"DD/*3>F ɾɾɾ
  11. ·ͱΊ 29 • 機械学習は、要するにパターン認識 • データをマッピングして、線を引くイメージ • ⽅法として、教師あり学習と教師なし学習がある • 教師あり→データにラベルがある

    • 教師なし→データにラベルがない • ラベルが数値の場合、回帰。ラベルがカテゴリの場合、分類。 • モデルの当てはまり・汎化性に気をつけよう • Rでは様々なアルゴリズムに対応するパッケージが⽤意されている • 使ってみて、統⼀感がないなあと思う場合はtidymodelsもおすすめ