Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
はじめての機械学習 / entrance-to-machine-learning2022
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
松村優哉
April 16, 2022
Programming
1.2k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
はじめての機械学習 / entrance-to-machine-learning2022
松村優哉
April 16, 2022
More Decks by 松村優哉
See All by 松村優哉
validateパッケージでデータを検証する / Data Validation with validate package
y__mattu
0
680
rstanの環境構築 / Set Up rstan
y__mattu
1
1.2k
R言語とGo言語 / R and Go
y__mattu
2
1.1k
はじめての機械学習 / Entrance to Machine Learning
y__mattu
0
820
平均値と中央値の違いについて
y__mattu
1
960
dplyr 1.0.0の新機能 / dplyr 1.0.0
y__mattu
2
10k
Other Decks in Programming
See All in Programming
AI時代の仕事技芸論 — ソフトウェア開発で「遊ぶように働く」職人的熟達のすすめ
kuranuki
2
670
セキュリティの専門家じゃなくてもできる。「セキュリティ意識」をアップデートして サプライチェーン攻撃への耐性を高めよう。
tk3fftk
5
750
RTSPクライアントを自作してみた話
simotin13
0
600
AI 時代のソフトウェア設計の学び方
masuda220
PRO
29
12k
ふつうのFeature Flag実践入門
irof
7
3.9k
「AIで開発し、AIを届ける」をEvalでつなぐ 〜AIネイティブに始めるプロダクト開発の実践〜 / Connecting "Develop with AI, deliver AI" with Eval
rkaga
4
5.1k
キャリア迷子上等 ─ "ない道"は自分で作ればいい
16bitidol
3
2.1k
Language Server 使ってる? 〜VSCode と Zed の場合〜 / Are you using a Language Server? ~For VS Code and Zed~
handlename
0
780
Technical Debt: Understanding it Rightly, Engaging it Rightly #LaravelLiveJP
shogogg
0
220
net-httpのHTTP/2対応について
naruse
0
480
肥大化するレガシーコードに立ち向かうためのインターフェース分離と依存の逆転 / JJUG CCC 2026 Spring
hirokunimaeta
0
550
TypeScript+Orvalで実現する型安全かつ堅牢でスケーラブルなマルチチャネル通知基盤 / TSKaigi Night talks ~after conference~
d0riven
0
330
Featured
See All Featured
Raft: Consensus for Rubyists
vanstee
141
7.5k
Utilizing Notion as your number one productivity tool
mfonobong
4
320
Code Review Best Practice
trishagee
74
20k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
Making Projects Easy
brettharned
120
6.7k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
350
Information Architects: The Missing Link in Design Systems
soysaucechin
0
970
A Modern Web Designer's Workflow
chriscoyier
698
190k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
Evolving SEO for Evolving Search Engines
ryanjones
0
220
Building AI with AI
inesmontani
PRO
1
1.1k
Transcript
͡Ίͯͷػցֶश !Z@@NBUUV 5PLZP3
୭ʁ • 名前: 松村優哉 • 学⽣時代の専⾨: 計量経済学、 ベイズ統計、因果推論、マーケティング (研究室のAWSの管理とかもやってた) •
⾔語: R(8年⽬くらい), Python • TVCM中⼼の広告系企業で データサイエンティストしてます • Tokyo.R 運営(初⼼者セッション等) • 近況: 引っ越しました(練⾺区⺠→世⽥⾕区⺠) @y__mattu ymattu 2
એ • Ӊ ધ ຊ͜ͱʰ<վఆ൛>3ϢʔβͷͨΊͷ34UVEJP<࣮ફ>ೖʱ 3 ୈষ 3TUVEJPͷجૅ ୈষ εΫϨΠϐϯάʹΑΔσʔλऩू
ୈষ EQMZSUJEZSʹΑΔσʔλલॲཧ ୈষ HHQMPUʹΑΔσʔλՄࢹԽ ୈষ 3.BSLEPXOʹΑΔσʔλՄࢹԽ ධൃചதʂʂ
࣍ • ػցֶशͱ • ڭࢣ͋Γֶश WTڭࢣͳֶ͠श • ྨ WTճؼ •
Ϟσϧબ • 3Ͱػցֶश 4
͜ͷࢿྉͷରɾత ର • ʮػցֶशʯͱ͍͏ݴ༿Λฉ͍ͨ͜ͱ͕͋Δ͕Α͘Θ͔Βͳ͍ • ͜Ε͔ΒσʔλੳΛษڧ͢Δ త • ʮػցֶशͬͯ݁ہԿΛͬͯΔͷʁʯΛͬ͘͟Γཧղ͢Δ •
ʮػցֶश ͍͠ʯPSʮػցֶशͬͯ"*ͰΊͬͪΌ͍͢͝ʯͱ͍͏Π ϝʔδͷ১ • ͜Ε͔Βษڧ͢Δͱ͖ͷ͓࣋ͬͯ͘ͱ͍͍ΠϝʔδΛʹ͚ͭΔ • Α͘ग़ͯ͘ΔΩʔϫʔυͷཧղ ͞ͳ͍͜ͱ • ࣜʹΑΔղઆ 5
ػցֶशͱ 6 • ⼀⾔で σʔλ͔ΒύλʔϯΛೝࣝ͠ɺ ະͷ͑Λ༧ଌ͢ΔͨΊͷϧʔϧΛ ࣗಈతʹ࡞Γग़͢Α͏ʹɺ ϚγϯʢίϯϐϡʔλʣΛτϨʔχϯά͢Δ
؆୯ͳΠϝʔδ 7 • 残業時間と退職のデータがあったとします • 残業時間で退職の有無をおよそ判断できるように、線を引く =パターン認識 ۀ࣌ؒ 退職した 退職しない
ۀ࣌ؒ
؆୯ͳΠϝʔδ 8 • 新しいデータが得られたとき、引いた線によって、退職の有無を予 測できる ۀ࣌ؒ
アルゴリズム データ モデル 線の引き⽅ 線が引かれている状態
ڭࢣ͋Γֶश WTڭࢣͳֶ͠श
ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 10 • ڭࢣ͋Γֶश • աڈͷσʔλͷதʹϥϕϧ͕͋Δ • ϞσϧͷதɺϥϕϧΛ༧ଌ͢ΔͨΊͷϧʔϧ ୀ৬ 1
0 0 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ తม ैଐม આ໌ม ಠཱม ༧ଌม ಛྔ
ڭࢣ͋ΓֶशͷදతͳΞϧΰϦζϜ 11 • ઢܗճؼ • ϩδεςΟοΫճؼɺ(-. • 47. • ܾఆɺϥϯμϜϑΥϨετ
• 9(#PPTUɺ-JHIU(#.
12 ୀ৬ 1 0 0 1 ۀ ࣌ؒ ྸ څ༩
ɾɾɾ アルゴリズム モデル ୀ৬ ︖ ︖ ︖ ︖ ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ୀ৬ 0 0 1 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ༧ଌ
ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 13 • ڭࢣͳֶ͠श • աڈͷσʔλͷதʹϥϕϧ͕ͳ͍ • Ϟσϧͷதɺάϧʔϓ͚ͷϧʔϧ • ϥϕϧɺ͚ΒΕͨ݁ՌΛݟͯਓ͕͚ͭΔ
ۀ ࣌ؒ ྸ څ༩ ɾɾɾ આ໌ม ಠཱม ༧ଌม ಛྔ ۀɾଟ څ༩ɾଟ ۀɾগ څ༩ɾଟ
ڭࢣͳֶ͠शͷදతͳΞϧΰϦζϜ 14 • ΫϥελϦϯά • ,NFBOT • ओੳ • ҟৗݕ
• τϐοΫϞσϧ
͔͜͜Βɺڭࢣ͋Γֶशʹ যΛͯͯ
ྨ WTճؼ
ྨͱճؼ 17 • ྨ • తม͕ΧςΰϦʔ • ճؼ • తม͕
ࣙΊΔʁࣙΊͳ͍ʁ ݘʁೣʁϥΠΦϯʁ དྷظͷडʁ དྷళʁ גՁʁ ೋྨ ଟྨɾଟΫϥεྨ
Ϟσϧબ Ϟσϧͷͯ·Γͱ൚Խੑ
Ϟσϧબ 19 • Ұ൪ྑ͍ઢͷҾ͖ํʁ • ֶशσʔλʹର͢Δਫ਼ • ະͷσʔλʹର͢Δ༧ଌྗ څྉ ۀ࣌ؒ
ສ ສ
Ϟσϧબ 20 • ڀۃతʹɺ͜͏ • ֶशσʔλʹର͢Δ༧ଌྗ • ະͷσʔλʹର͢Δ༧ଌྗऑͦ͏ څྉ ۀ࣌ؒ
ສ ສ ະͷσʔλ͕͜͜ͷͱ͖ɺ ϞσϧͲͪΒͱ༧ଌ͢Δʁ
Ϟσϧબ 21 • ͜ͷ͘Β͍͕όϥϯεྑͦ͞͏ • ֶशσʔλʹର͢Δ༧ଌྗ • ະͷσʔλʹର͢Δ༧ଌྗڧͦ͏ څྉ ۀ࣌ؒ
ສ ສ
Ϟσϧબ 22 • ະͷσʔλͷ༧ଌྗڧͦ͏ɺऑͦ͏ΛͲ͏அ͢Δ͔ʁ ˠσʔλΛֶश༻ɺςετ༻ʹׂͯ͠ɺςετ༻Ͱ༧ଌྗΛଌΔ • ࢀߟΫϩεόϦσʔγϣϯ ୀ৬ 1 0
0 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ֶश༻ ςετ༻ ϥϯμϜʹ͘Β͍͕ଟ͍ IUUQTRJJUBDPN
[email protected]
JUFNTEFFEDCBC
ྨΛ3ͰͬͯΈΔ
ѻ͏σʔλ 24 • ペンギンデータ JOTUBMMQBDLBHFT QBMNFSQFOHVJOT MJCSBSZ QBMNFSQFOHVJOT EBUB
QBDLBHFQBMNFSQFOHVJOT` IFBE QFOHVJOT "UJCCMFY TQFDJFTJTMBOECJMM@MFOHUI@NN CJMM@EFQUI@NN GMJQQFS@MFOHUI@ʜCPEZ@NBTT@H TFY GDUGDUECMECMJOUJOUGDU "EFMJF5PSHFʜNBMF "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜ/"/"/"/"/" "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜNBMF ʜXJUINPSFWBSJBCMFZFBSJOU EBU QFOHVJOT EQMZSGJMUFS JTOB TFY TFY͕ܽଛͷྻΛআ֎
ܾఆϞσϧ 25 σʔλΛׂ JEY TBNQMF OSPX EBU OSPX EBU
EBUBUSBJO EBU<JEY > EBUBUFTU EBU<JEY > NPEFMEU QBSUZLJUDUSFF TQFDJFTd EBUBEBUBUSBJO QMPU NPEFMEU UZQFTJNQMF
ϥϯμϜϑΥϨετ 26 IUUQTXXXOJLLFJSDPKQHMPTTBSZJE
ϥϯμϜϑΥϨετ 27 NPEFMSG SBOHFSSBOHFS TQFDJFTd EBUBEBUBUSBJO NUSZ OVNUSFFT
SFTVMUSG QSFEJDU NPEFMEU EBUBUFTU DNSG DBSFUDPOGVTJPO.BUSJY SFTVMUSG EBUBUFTUTQFDJFT $POGVTJPO.BUSJYBOE4UBUJTUJDT 3FGFSFODF 1SFEJDUJPO"EFMJF$IJOTUSBQ(FOUPP "EFMJF $IJOTUSBQ (FOUPP 0WFSBMM4UBUJTUJDT "DDVSBDZ $* /P*OGPSNBUJPO3BUF 17BMVF<"DD/*3>F ɾɾɾ
·ͱΊ
·ͱΊ 29 • 機械学習は、要するにパターン認識 • データをマッピングして、線を引くイメージ • ⽅法として、教師あり学習と教師なし学習がある • 教師あり→データにラベルがある
• 教師なし→データにラベルがない • ラベルが数値の場合、回帰。ラベルがカテゴリの場合、分類。 • モデルの当てはまり・汎化性に気をつけよう • Rでは様々なアルゴリズムに対応するパッケージが⽤意されている • 使ってみて、統⼀感がないなあと思う場合はtidymodelsもおすすめ