Upgrade to Pro — share decks privately, control downloads, hide ads and more …

コンペに公開されているデータを使っての機械学習事始め / pyml-niigata-20180818

コンペに公開されているデータを使っての機械学習事始め / pyml-niigata-20180818

Python機械学習勉強会 in 新潟 Restart (2018/08/18) で発表した資料です。

kasacchiful

August 18, 2018
Tweet

More Decks by kasacchiful

Other Decks in Programming

Transcript

  1. Kaggleͱ͸ • ੈքதͷσʔλαΠΤϯςΟετ͕ू·Γɺ͠ͷ͗Λ࡟ΔϓϥοτϑΥʔϜ • ୅දతͳίϯϖͷ՝୊ • ϩʔϯͷσϑΥϧτϦεΫ൑ఆ • Ϣʔβͷෆਖ਼ΞΫηεݕ஌ •

    ը૾಺ͷΦϒδΣΫτݕग़ • Φεεϝग़඼Ձ֨ͷఏࣔ • etc. • KaggleʹࢀՃ͍ͯ͠Δਓͷ͜ͱΛʮKagglerʯͱݺΜͩΓ͢Δ
  2. KaggleΛͷ͍ͧͯΈΑ͏ • Competition • ίϯϖͷҰཡ • Datasets • Kaggle͕ެ։͍ͯ͠ΔσʔληοτͷҰཡ •

    Kernels • kaggler͕֤໰୊ͷղ͖ํΛNotebookܗࣜͰ͍ࣔͯ͠Δ • ·ͣ͸໰୊ͷղ͖ํΛࣸܦͯ͠ɺྲྀΕΛݟΔͷ͕Φεεϝ • Discussion • kagglerಉ͕࢜ٞ࿦͠߹͏ܝࣔ൘ • ࠷৽ΞϧΰϦζϜ౳ͷτϐοΫε͕ग़͖ͯͨΓ͢Δ • learn • Python/R΍ɺPandasɺػցֶशɺσΟʔϓϥʔχϯάɺՄࢹԽͳͲͷجຊΛNotebookܗࣜͰެ։
  3. σʔλαΠΤϯςΟετʹͳΔ ͨΊʹඞཁͳ8ͭͷεΩϧ 1. Programming Skills (Python / R / SQL)

    2. Statistics (౷ܭͷ஌ࣝʣ 3. Machine Learning (ػցֶशͷཧ࿦) 4. Multivariable Calculus & Linear Algebra (ଟม਺ඍ෼ੵ෼ͱઢܗ୅਺) 5. Data Wrangling (σʔλͷૢ࡞(Pandas / dplyr)) 6. Data Visualization & Communication (σʔλͷՄࢹԽ) 7. Software Engineering (σʔλΛूΊͨΓσʔλۦಈܕ੡඼։ൃ͢ΔͨΊͷΤϯδχΞϦϯάྗ) 8. Data Intuition (σʔλʹର͢Δʮ௚ײྗʯ) Ҿ༻: 8 Skills You Need to Be a Data Scientist | Udacity https://blog.udacity.com/2014/11/data-science-job-skills.html
  4. ίϯϖͰ਎ʹͭ͘ͱࢥ͏εΩϧ 1. Programming Skills (Python / R / SQL) 2.

    Statistics (౷ܭͷ஌ࣝʣ 3. Machine Learning (ػցֶशͷཧ࿦) 4. Multivariable Calculus & Linear Algebra (ଟม਺ඍ෼ੵ෼ͱઢܗ୅਺) 5. Data Wrangling (σʔλͷૢ࡞(Pandas / dplyr)) 6. Data Visualization & Communication (σʔλͷՄࢹԽ) 7. Software Engineering (σʔλΛूΊͨΓσʔλۦಈܕ੡඼։ൃ͢ΔͨΊͷΤϯδχΞϦϯάྗ) 8. Data Intuition (σʔλʹର͢Δʮ௚ײྗʯ) ˕ ̋: ࠷ॳ͸͍Βͳ͍͚Ͳɺ্Ґૂ͏ͳΒඞཁ ̋: ࠷ॳ͸͍Βͳ͍͚Ͳɺ্Ґૂ͏ͳΒඞཁ ̋: ࠷ॳ͸͍Βͳ͍͚Ͳɺ্Ґૂ͏ͳΒඞཁ ˕ ˚: ίϯϖ͚ͩͰ͸਎ʹ͔ͭͳ͍͔΋ ˚: ίϯϖ͚ͩͰ͸਎ʹ͔ͭͳ͍͔΋ ˕
  5. ࿅श໰୊ʹఏग़ • ͲͪΒͷίϯϖʹ΋͋Δ࿅श໰୊ʮTitanicʯΛ΍ͬͯΈ·͢ • Kaggle: “Titanic: Machine Learning from Disaster”

    • https://www.kaggle.com/c/titanic • SIGNATE: “ʲ࿅श໰୊ʳλΠλχοΫͷੜଘ༧ଌ” • https://signate.jp/competitions/102 λΠλχοΫ߸௜຅ࣄނ λΠλχοΫ͝͏ͪΜ΅ͭ͜͡ ͸ɺ೥݄೔ͷ໷͔Β೔ͷேʹ͔͚ͯɺ ΠΪϦεɾα΢αϯϓτϯ͔ΒΞϝϦΧ߹ऺࠃɾχϡʔϤʔΫߦ͖ͷॲঁߤւதͷ೔໨ʹ๺େ੢༸Ͱى͖ͨɻ ౰࣌࠷େͷ٬ધͰ͋ͬͨλΠλχοΫ߸͸ɺ೥݄೔ͷ࣌෼ ࣄނݱ৔࣌ؒ ʹණࢁʹিಥͨ࣌͠ ʹ͸ ਓΛ৐͍ͤͯͨɻࣄނ͕ى͖͔ͯΒ࣌ؒ෼ޙͷཌ݄೔ͷ࣌෼ʹ௜຅͠ɺ ਓҎ্͕ ๢͘ͳͬͨɻ͜Ε͸೥౰࣌ɺւ೉ࣄނͷ࠷େࢮऀ਺Ͱ͋ͬͨɻ Ҿ༻: λΠλχοΫ߸௜຅ࣄނ - Wikipedia https://ja.wikipedia.org/wiki/λΠλχοΫ߸௜຅ࣄނ
  6. ·ͱΊ • ػցֶशʹڵຯ͋Δ͚Ͳɺσʔλ࣋ͬͯͳ͍ 㱺 kaggle΍SIGNATEʹ͋ΔσʔλΛ࢖ͬͯ࿅शʂ • ػցֶशʹڵຯ͋Δ͚ͲɺͲ͏΍ͬͯεΩϧ্͛Ε͹͍͍ͷʁ 㱺 KaggleͷKernels͸ͱͯ΋ࢀߟʹͳΔʂͦͷதͰΘ͔Βͳ͍୯ޠ΍ख๏͸ผ్ௐ ΂ͯΈΑ͏ʂ

    • Kaggle͸ӳޠͰ͠ΐ… 㱺 จ໌ͷརث (Google຋༁) ͕͋ΔͷͰɺͳΜͱ͔ͳΔɻ·ͨɺӳޠͷઐ໳༻ޠ͸ CourseraͷʮMachine LearningʯίʔεΛऔΓ૊ΜͰ͍͘ͱɺࣗવͱΘ͔ͬͯ͘Δ