みんなのPython勉強会#48 - connpass https://startpython.connpass.com/event/124253/ で発表する資料です
ػցֶशਤؑͷோΊํΈΜͳͷ Python ษڧձ#48 - connpass
View Slide
࣍1.ॻ੶Ͱѻ͏ΞϧΰϦζϜͷશମ૾2.ྨ3.ճؼ4.ΫϥελϦϯά5.࣍ݩݮ6.࠷ޙʹ
ࣗݾհ• ਿࢁ Ѩ• Software Engineer @Repro• ػցֶशͱ͔౷ܭͱ͔։ൃͱ͔• ػցֶशਤؑ ڞஶ
ΞϧΰϦζϜͷղઆํ1.Πϝʔδ͕ΘΔΑ͏ʹ͢Δ• Web ΤϯδχΞ͕งғؾΛΘ͔Δ• ݫີ͞ΑΓΘ͔Γ͢͞2.ࣜΛ༻͍ͨৄࡉͳهड़ߦΘͳ͍• ຊޠͱਤͰؤுΔ• ຊࢿྉͷਤͷେຊ͔ΒҾ༻
հ͢ΔΞϧΰϦζϜͷબఆج४• ػցֶशΞϧΰϦζϜΛ၆ᛌͰ͖ΔΑ͏ʹબఆ• scikit-learn ͷ Choosing theright estimator Λࢀߟʹબఆ
ྨ (Classification)• ࢄΛ༧ଌ͢Δ! y-1 00 01 12 ?3 1
ྨͷྫ• ΞϠϝͷྨ͕༗໊• ΨΫย (sepal) ͱՖห (petal) ͷ͞ͱ෯͔ΒΞϠϝͷछྨΛ༧ଌ• σʔλ͔Βܾఆڥք (ڥ) Λֶश
ྨʹద༻Ͱ͖ΔΞϧΰϦζϜ• ϩδεςΟοΫճؼ• αϙʔτϕΫτϧϚγϯ• φΠʔϒϕΠζ• ϥϯμϜϑΥϨετ• χϡʔϥϧωοτϫʔΫ• kNN
αϙʔτϕΫτϧϚγϯ• ΞϧΰϦζϜϋΠύʔύϥϝʔλʔʹΑֶͬͯश͢Δܾఆڥքͷܗ͕ҟͳΔ• ಉ͡σʔλΛ༻͍ͯɺαϙʔτϕΫτϧϚγϯͷΧʔωϧؔΛมֶ͑ͯशͤͨ݁͞Ռ͕ӈਤ
༩͑ํʹΑͬͯΑ͘Θ͔Βͳ͍ܗʹͳΔ
ճؼ (Regression)• ࿈ଓΛ༧ଌ͢Δ! ! y1 0 11 1 22 2 ?2 3 5
ճؼͷྫ• ϘετϯͷॅՁ֨༧ଌ͕༗໊• ΑΓ؆୯ͳσʔλͱͯ͠ΞϯείϜͷσʔληοτ͕͋Δ (ӈਤ)• ͜ΕΒͷΛ͏·ۙ͘ࣅ͢ΔΑ͏ͳۂઢ (ઢΛؚΉ) Λֶश͢Δ
ճؼʹద༻Ͱ͖ΔΞϧΰϦζϜ• ઢܗճؼ• αϙʔτϕΫτϧϚγϯ• ϥϯμϜϑΥϨετ• χϡʔϥϧωοτϫʔΫ• kNN
ΞϯείϜͷσʔληοτ• ՄࢹԽͷॏཁੑΛࣔ͢σʔληοτ• 4 ͭͷσʔληοτʹ͍ͭͯɺ࣍ͷ͕΄΅ಉ͡1.ฏۉ2.ࢄ3.૬ؔ4.ճؼઢͷยͱ͖• ࢦඪΛ༻͍ͨධՁՄࢹԽ྆ํॏཁ
ΫϥελϦϯά• ͜Ε·Ͱڭࢣ͋Γ• ͋ΔมͷΛ༧ଌ͢Δ• ͔͜͜Βڭࢣͳ͠• σʔλͦͷͷ͔Βֶश͢Δ• ΫϥελϦϯά• ࣅͨͷಉ࢜ͷσʔλΛΫϥελͱͯ͠·ͱΊΔख๏• ࠨͷਤͷσʔλΛӈͷਤͷΑ͏ʹσʔλΛׂ͢Δ
ΫϥελϦϯάΛߦ͏ΞϧΰϦζϜ• k-means ๏• ࠞ߹Ψε (Λ༻͍ͨΫϥελϦϯά)• etc.
k-means ๏ͷֶशͷ༷ࢠ• Ϋϥελͷॏ৺ΛదʹܾΊΔ (ΫϥελࣗͰܾΊΔ)• σʔλΛ͍ۙ΄͏ͷʹྨ͠ɺฏۉΛٻΊΔ͜ͱΛ܁Γฦ͢
࣍ݩݮ• ՄࢹԽେࣄ (ΞϯείϜͷσʔληοτ)• σʔλΛՄࢹԽ͢Δ͜ͱࠔͳ͜ͱ͕ଟ͍• ΞϠϝσʔλͰΨΫย͞ͱ෯ɺՖหͷ͞ͱ෯Λߟ͑Δͱ 4 ࣍ݩͳͷͰͦͷ··ͰՄࢹԽͰ͖ͳ͍• σʔλͷߏΛอͬͨ··͏·࣍͘ݩΛམͱ͍ͨ͠• σʔλͷഎܠʹͳ͍ͬͯΔใΛ͏·͘நग़͍ͨ͠
࣍ݩݮͷྫ• 3 ࣍ݩ͔Β 2 ࣍ݩʹ࣍ݩݮͨ͠ྫ• (a) ݩσʔλ• (b) LLE Ͱ࣍ݩݮ• (c) PCA Ͱ࣍ݩݮ• LLE ͷํ͕ݩͷߏΛอͬͨ··ల։Ͱ͖͍ͯΔ
࣍ݩݮΞϧΰϦζϜ• PCA• LSA• NMF• LDA• t-SNE• etc.
खॻ͖จࣈσʔλͷ࣍ݩݮ
࠷ޙʹ• ΞϧΰϦζϜ͕ͯ͢Ͱͳ͍• ͦΕҎ֎ʹେมͳͱ͜Ζ͕͋Δ
An Extended Version OfThe Scikit-Learn CheatSheet1• ๏໘େৎʁ• σʔλʹΞΫηεͰ͖Δʁ• σʔλͷதཧղͨ͠ʁ• σʔλ͖Ε͍ʁ• ՝໌֬ʁ1 https://medium.com/@chris_bour/an-extended-version-of-the-scikit-learn-cheat-sheet-5f46efc6cbb
Recap࣍ ༰1. ॻ੶Ͱѻ͏ΞϧΰϦζϜͷશମ૾ ྨɾճؼɾΫϥελϦϯάɾ࣍ݩݮΛѻ͏2. ྨ ࢄΛ༧ଌ͢Δ3. ճؼ ࿈ଓΛ༧ଌ͢Δ4. ΫϥελϦϯά ࣅͨͷಉ࢜ͷσʔλΛ·ͱΊΔ5. ࣍ݩݮ ෳࡶͳߏͷσʔλΛγϯϓϧʹ͢Δ6. ࠷ޙʹ ݱ࣮ෳࡶͳͷͰΞϧΰϦζϜҎ֎େ