Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
はじめての機械学習 / Entrance to Machine Learning
Search
松村優哉
April 17, 2021
Programming
820
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
はじめての機械学習 / Entrance to Machine Learning
松村優哉
April 17, 2021
More Decks by 松村優哉
See All by 松村優哉
はじめての機械学習 / entrance-to-machine-learning2022
y__mattu
2
1.2k
validateパッケージでデータを検証する / Data Validation with validate package
y__mattu
0
680
rstanの環境構築 / Set Up rstan
y__mattu
1
1.2k
R言語とGo言語 / R and Go
y__mattu
2
1.1k
平均値と中央値の違いについて
y__mattu
1
960
dplyr 1.0.0の新機能 / dplyr 1.0.0
y__mattu
2
10k
Other Decks in Programming
See All in Programming
JJUG CCC 2026 Spring: JSpecify で実現する Kotlin フレンドリーな Java API 設計
ternbusty
1
170
Datadog × OpenTelemetry 入門と実践のあいだ
kn_to_maxpno
1
160
Go1.27で導入されるジェネリクスメソッドでできること
mackee
0
120
LLMによるContent Moderationの本番運用の裏側と品質担保への挑戦
suikabar
2
640
AIとASP.NET Coreで雑Webアプリを作った話
mayuki
0
600
Creating Composable Callables in Contemporary C++
rollbear
0
130
Dataformのリポジトリを立ち上げるときにまずやること / dataform-day0-2026
snhryt
0
160
Vite+ Unified Toolchain for the Web
naokihaba
0
300
過去最大のMCPアップデート! 2026-07-28 RC版の謎に迫る
licux
6
300
IBM Bobを活用したレガシーアプリの最新化
oniak3ibm
PRO
1
200
例外の正しい扱い方 そのエラー try-catchして大丈夫?
jinwatanabe
0
230
肥大化するレガシーコードに立ち向かうためのインターフェース分離と依存の逆転 / JJUG CCC 2026 Spring
hirokunimaeta
0
550
Featured
See All Featured
GitHub's CSS Performance
jonrohan
1033
470k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
230
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
The agentic SEO stack - context over prompts
schlessera
0
820
The Cost Of JavaScript in 2023
addyosmani
55
10k
What does AI have to do with Human Rights?
axbom
PRO
1
2.2k
We Are The Robots
honzajavorek
0
250
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.3k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
Transcript
͡Ίͯͷػցֶश !Z@@NBUUV 5PLZP3
୭ʁ • 名前: 松村優哉 • 学⽣時代の専⾨: 計量経済学、 ベイズ統計、因果推論、マーケティング (研究室のAWSの管理とかもやってた) •
⾔語: R, Python • HR系企業でデータサイエンティストしてます • Tokyo.R 運営(初⼼者セッション等) @y__mattu ymattu 2
એ • Ӊຊ͜ͱʰ3ϢʔβͷͨΊͷ34UVEJP<࣮ફ>ೖʱ 3 ୈষ 3TUVEJPͷجૅ ୈষ εΫϨΠϐϯάʹΑΔσʔλऩू ୈষ EQMZSUJEZSʹΑΔσʔλલॲཧ
ୈষ HHQMPUʹΑΔσʔλՄࢹԽ ୈষ 3.BSLEPXOʹΑΔσʔλՄࢹԽ վగୈ൛ൃചܾఆʂʂʂ ओͳมߋ • ࠷৽ͷ34UVEJP ֤छύοέʔδʹରԠ • จࣈྻૢ࡞ʢTUSJOHSʣૢ࡞ʢMVCSJEBUFʣʹؔ͢Δ
࣍ • ػցֶशͱ • ڭࢣ͋Γֶश WTڭࢣͳֶ͠श • ྨ WTճؼ •
Ϟσϧબ • 3Ͱػցֶश 4
͜ͷࢿྉͷରɾత ର • ʮػցֶशʯͱ͍͏ݴ༿ΛॳΊͯฉ͘ • ͜Ε͔ΒσʔλੳΛษڧ͢Δ త • ʮػցֶशͬͯ݁ہԿΛͬͯΔͷʁʯΛͬ͘͟Γཧղ͢Δ •
ʮػցֶश ͍͠ʯPSʮػցֶशͬͯ"*ͰΊͬͪΌ͍͢͝ʯͱ͍͏Π ϝʔδͷ১ • ͜Ε͔Βษڧ͢Δͱ͖ͷ͓࣋ͬͯ͘ͱ͍͍ΠϝʔδΛʹ͚ͭΔ • Α͘ग़ͯ͘ΔΩʔϫʔυͷཧղ ͞ͳ͍͜ͱ • ࣜʹΑΔղઆ 5
ػցֶशͱ 6 • ⼀⾔で σʔλ͔ΒύλʔϯΛೝࣝ͠ɺ ະͷ͑Λ༧ଌ͢ΔͨΊͷϧʔϧΛ ࣗಈతʹ࡞Γग़͢Α͏ʹɺ ϚγϯʢίϯϐϡʔλʣΛτϨʔχϯά͢Δ
؆୯ͳΠϝʔδ 7 • 残業時間と退職のデータがあったとします • 残業時間で退職の有無をおよそ判断できるように、線を引く =パターン認識 ۀ࣌ؒ 退職した 退職しない
ۀ࣌ؒ
؆୯ͳΠϝʔδ 8 • 新しいデータが得られたとき、引いた線によって、退職の有無を予 測できる ۀ࣌ؒ
アルゴリズム データ モデル 線の引き⽅ 線が引かれている状態
ڭࢣ͋Γֶश WTڭࢣͳֶ͠श
ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 10 • ڭࢣ͋Γֶश • աڈͷσʔλͷதʹϥϕϧ͕͋Δ • ϞσϧͷதɺϥϕϧΛ༧ଌ͢ΔͨΊͷϧʔϧ ୀ৬ 1
0 0 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ తม ैଐม આ໌ม ಠཱม ༧ଌม ಛྔ
ڭࢣ͋ΓֶशͷදతͳΞϧΰϦζϜ 11 • ઢܗճؼ • ϩδεςΟοΫճؼɺ(-. • 47. • ܾఆɺϥϯμϜϑΥϨετ
• 9(#PPTUɺ-JHIU(#. ΄͔ʹͨ͘͞Μ
12 ୀ৬ 1 0 0 1 ۀ ࣌ؒ ྸ څ༩
ɾɾɾ アルゴリズム モデル ୀ৬ ︖ ︖ ︖ ︖ ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ୀ৬ 0 0 1 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ༧ଌ
ͲͷΑ͏ʹϞσϧΛֶश͢Δ͔ 13 • ڭࢣͳֶ͠श • աڈͷσʔλͷதʹϥϕϧ͕ͳ͍ • Ϟσϧͷதɺάϧʔϓ͚ͷϧʔϧ • ϥϕϧɺ͚ΒΕͨ݁ՌΛݟͯਓ͕͚ͭΔ
ۀ ࣌ؒ ྸ څ༩ ɾɾɾ આ໌ม ಠཱม ༧ଌม ಛྔ ۀɾଟ څ༩ɾଟ ۀɾগ څ༩ɾଟ
ڭࢣͳֶ͠शͷදతͳΞϧΰϦζϜ 14 • ΫϥελϦϯά • ,NFBOT • ओੳ • ҟৗݕ
• τϐοΫϞσϧ ΄͔ʹͨ͘͞Μ
͔͜͜Βɺڭࢣ͋Γֶशʹ যΛͯͯ
ྨ WTճؼ
ྨͱճؼ 17 • ྨ • తม͕ΧςΰϦʔ • ճؼ • తม͕
ࣙΊΔʁࣙΊͳ͍ʁ ݘʁೣʁϥΠΦϯʁ དྷظͷडʁ དྷళʁ גՁʁ ೋྨ ଟྨɾଟΫϥεྨ
Ϟσϧબ Ϟσϧͷͯ·Γͱ൚Խੑ
Ϟσϧબ 19 • Ұ൪ྑ͍ઢͷҾ͖ํʁ • ֶशσʔλʹର͢Δਫ਼ • ະͷσʔλʹର͢Δ༧ଌྗ څྉ ۀ࣌ؒ
ສ ສ
Ϟσϧબ 20 • ڀۃతʹɺ͜͏ • ֶशσʔλʹର͢Δ༧ଌྗ • ະͷσʔλʹର͢Δ༧ଌྗऑͦ͏ څྉ ۀ࣌ؒ
ສ ສ ະͷσʔλ͕͜͜ͷͱ͖ɺ ϞσϧͲͪΒͱ༧ଌ͢Δʁ
Ϟσϧબ 21 • ͜ͷ͘Β͍͕όϥϯεྑͦ͞͏ • ֶशσʔλʹର͢Δ༧ଌྗ • ະͷσʔλʹର͢Δ༧ଌྗڧͦ͏ څྉ ۀ࣌ؒ
ສ ສ
Ϟσϧબ 22 • ະͷσʔλͷ༧ଌྗڧͦ͏ɺऑͦ͏ΛͲ͏அ͢Δ͔ʁ ˠσʔλΛֶश༻ɺςετ༻ʹׂͯ͠ɺςετ༻Ͱ༧ଌྗΛଌΔ • ࢀߟΫϩεόϦσʔγϣϯ ୀ৬ 1 0
0 1 ۀ ࣌ؒ ྸ څ༩ ɾɾɾ ֶश༻ ςετ༻ ϥϯμϜʹ͘Β͍͕ଟ͍ IUUQTRJJUBDPN
[email protected]
JUFNTEFFEDCBC
ྨΛ3ͰͬͯΈΔ
ѻ͏σʔλ 24 • ペンギンデータ JOTUBMMQBDLBHFT QBMNFSQFOHVJOT MJCSBSZ QBMNFSQFOHVJOT EBUB
QBDLBHFQBMNFSQFOHVJOT` IFBE QFOHVJOT "UJCCMFY TQFDJFTJTMBOECJMM@MFOHUI@NN CJMM@EFQUI@NN GMJQQFS@MFOHUI@ʜCPEZ@NBTT@H TFY GDUGDUECMECMJOUJOUGDU "EFMJF5PSHFʜNBMF "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜ/"/"/"/"/" "EFMJF5PSHFʜGFNBʜ "EFMJF5PSHFʜNBMF ʜXJUINPSFWBSJBCMFZFBSJOU EBU QFOHVJOT EQMZSGJMUFS JTOB TFY TFY͕ܽଛͷྻΛআ֎
ܾఆϞσϧ 25 σʔλΛׂ JEY TBNQMF OSPX EBU OSPX EBU
EBUBUSBJO EBU<JEY > EBUBUFTU EBU<JEY > NPEFMEU QBSUZLJUDUSFF TQFDJFTd EBUBEBUBUSBJO QMPU NPEFMEU UZQFTJNQMF
ϥϯμϜϑΥϨετ 26 IUUQTTQFBLFSEFDLDPNLBOBVHVTUFYQMPSBUPSZTFNJOBOVNCFSKJKJFYVFYJ TMJEF
ϥϯμϜϑΥϨετ 27 NPEFMSG SBOHFSSBOHFS TQFDJFTd EBUBEBUBUSBJO NUSZ OVNUSFFT
SFTVMUSG QSFEJDU NPEFMEU EBUBUFTU DNSG DBSFUDPOGVTJPO.BUSJY SFTVMUSG EBUBUFTUTQFDJFT $POGVTJPO.BUSJYBOE4UBUJTUJDT 3FGFSFODF 1SFEJDUJPO"EFMJF$IJOTUSBQ(FOUPP "EFMJF $IJOTUSBQ (FOUPP 0WFSBMM4UBUJTUJDT "DDVSBDZ $* /P*OGPSNBUJPO3BUF 17BMVF<"DD/*3>F ɾɾɾ
·ͱΊ
·ͱΊ 29 • 機械学習は、要するにパターン認識 • データをマッピングして、線を引くイメージ • ⽅法として、教師あり学習と教師なし学習がある • 教師あり→データにラベルがある
• 教師なし→データにラベルがない • ラベルが数値の場合、回帰。ラベルがカテゴリの場合、分類。 • モデルの当てはまり・汎化性に気をつけよう • Rでは様々なアルゴリズムに対応するパッケージが⽤意されている • 使ってみて、統⼀感がないなあと思う場合はtidymodelsもおすすめ