Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ANNとナイーブベイズを使った雑な野球選手の成績予測 / Baseball player p...
Search
Shinichi Nakagawa
PRO
July 22, 2020
Research
0
3k
ANNとナイーブベイズを使った雑な野球選手の成績予測 / Baseball player performance prediction with Python
PyCon JP 2020で話す予定の話のダイジェストです.
kawasaki.rb #86 での練習試合.
#Python #DataScience #MLB #Baseball
Shinichi Nakagawa
PRO
July 22, 2020
Tweet
Share
More Decks by Shinichi Nakagawa
See All by Shinichi Nakagawa
実践Dash - 手を抜きながら本気で作るデータApplicationの基本と応用 / Dash for Python and Baseball
shinyorke
PRO
2
2.2k
Terraform, GitHub Actions, Cloud Buildでデータ基盤をProvisioningする / Data Platform provisioning for Google Cloud and Terraform
shinyorke
PRO
2
3k
Cloud RunとCloud PubSubでサーバレスなデータ基盤2024 with Terraform / Cloud Run and PubSub with Terraform
shinyorke
PRO
9
3.5k
自らを強いエンジニアにするための3つの習慣 / I need to be myself, I can't be no one else
shinyorke
PRO
82
80k
阪神タイガース優勝のひみつ - Pythonでシュッと調べた件 / SABRmetrics for Python
shinyorke
PRO
1
1.3k
Pythonとクラウドと野球の推し活. / Baseball Data Platform for Python and Google Cloud
shinyorke
PRO
2
2.8k
月額コーヒー3.34杯分のコストでオオタニサンの活躍を見守るデータ基盤のはなし / Pyhack Con
shinyorke
PRO
2
480
俺のDXを実現するためのサーバレスなデータ基盤開発と運用 / Serverless Data Platform and Baseball
shinyorke
PRO
5
12k
機械学習エンジニアが目指すキャリアパスとその実話 / My Journey to Become a ML Engineer
shinyorke
PRO
10
17k
Other Decks in Research
See All in Research
サーブレシーブ成功率は勝敗に影響するか?
vball_panda
0
540
書き手はどこを訪れたか? - 言語モデルで訪問行動を読み取る -
hiroki13
0
140
セミコン地域における総合交通戦略
trafficbrain
0
120
Optimal and Diffusion Transports in Machine Learning
gpeyre
0
1.2k
Neural Fieldの紹介
nnchiba
2
680
地理空間情報と自然言語処理:「地球の歩き方旅行記データセット」の高付加価値化を通じて
hiroki13
1
190
Bluesky Game Dev
trezy
0
150
Human-Informed Machine Learning Models and Interactions
hiromu1996
2
570
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)
reisato12345
0
340
Weekly AI Agents News!
masatoto
31
53k
IM2024
mamoruk
0
230
Tiaccoon: コンテナネットワークにおいて複数トランスポート方式で統一的なアクセス制御
hiroyaonoe
0
420
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
How GitHub (no longer) Works
holman
314
140k
Practical Orchestrator
shlominoach
186
10k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Producing Creativity
orderedlist
PRO
344
39k
A Philosophy of Restraint
colly
203
16k
Docker and Python
trallard
44
3.3k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
4
360
Building a Modern Day E-commerce SEO Strategy
aleyda
38
7.1k
Building Your Own Lightsaber
phodgson
104
6.2k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.4k
Transcript
ٿબखͷ༧ଌϞσϧΛ ͍͍ײ͡ʹ࡞ͬͯΈͨVer 1.0 Shinichi Nakagawa (@shinyorke) kawasaki.rb #86 7पͪΐͬͱLTେձ
Who am I ? • Shinichi Nakagawa(@shinyorke) • JX௨৴ࣾγχΞɾΤϯδχΞ •
࠷ۙͣͬͱσʔλج൫ɾσʔλੳ͍ͯ͠ΔϚϯ • ຊདྷٿσʔλαΠΤϯεʹڧ͍ਓ • ٕज़ސ͡Ί·ͨ͠
kwsk.pyҊ݅Ͱ͢ :bow: PyCon JPʹ2ͿΓ6ճͷ⽁Λ͢Δ͜ͱʹͳΓ·ͯ͠. ٱ͠ͿΓʹนଧͪʹͬͯ·͍Γ·͓͖ͨ͠߹͍͍ͩ͘͞⽁
ʲਤʳࠓճ͖ͬͯͨ͜ͱ ຊ֨తͳ։ൃ4݄͔Β, ࠷ޙͷλεΫ͕௨ͬͨͷ͕͍ͭ࠷ۙ اըɾߏؚΊΔͱ࣮͍ۙϓϩδΣΫτͩͬͨΓ
None
σʔληοτ࡞ɾಛྔநग़ • ϝδϟʔϦʔάͷσʔλʮSean Lahmanʯʮretrosheetʯ ͜ΕΒΛͯ͢BigQueryʹimport • CSV͔Βςʔϒϧ࡞ • ػցֶशλεΫʹඞཁͳಛྔΛ۪ʹࢉग़
ػցֶशλεΫͦͷᶃ ʮࣅ͍ͯΔબखΫϥελΛ࡞Δʯ
कඋҐஔɾͷงғؾͰΫϥελϦϯά • ࡶʹݴ͏ͱ, ʮ˓˓ͬΆ͍બखϥϯΩϯάʯΛ࡞Δ • ྫ͑ࡔຊ༐ਓʢڊਓʣͬΆ͍બखʁͱݴΘΕͨΒ, ʮकඋҐஔ͕γϣʔτʯʮৗʹ3ׂ20ຊྥଧଧͭʯ ͱ͔ͦΜͳײ͡. γϣʔτͰ͋Δ͜ͱϚετ, ͋ͱଧܸ࣍ୈ.
• ଧܸ͓ΑͼҰ෦ͷकඋࢦඪΛͬͯϢʔΫϦουڑΛ ٻΊͯ૯ΓͰ֤બखͷʮͦΕͬΆ͍ϥϯΩϯάʯΛ࡞Εͦ͏.
ۙࣅ࠷ۙ୳ࡧʢANNʣͰͬͯΈͨ • kNNͱ͔k-meansͱ͔Γํ৭ʑ͚͋ͬͨͲANNͰͬͨ݁Ռ ͕͍͖ͳΓ͍͍ײͩͬͨ͡ͷͰ͜Εʹͨ͠. • ANNͷλεΫAnnoy͍ͬͯ͏ϥΠϒϥϦͰര։ൃ. • ϝδϟʔϦʔΨʔ19,000ਓͷσʔλͰͬͨΒ͍͍ײ͡ʹ.
ίʔυʢҰ෦ൈਮʣ˞ಛྔൿີ ֶश͔ΒϞσϧอଘͨͬͨ͜Ε͚ͩ. σʔλେ͖͘ͳ͍ͷͰඵͰऴΘΓ·ͨ͠.
ϚοτɾνϟοϓϚϯʢMLBएखࡾྥखʣʹ͍ۙબख ٬؍తͳσʔλ͔Β, ϑΝϯͱͯͬͯ͠Δͱͯ͠. ͍ۙબख͕ͪΌΜͱू·Γ·ͨ͠, શһࡾྥखͰଧܸͰ݁Ռग़ͤΔϚϯͳͷͰจ۟ͳ͠ʂ
ࣅ͍ͯΔબखूΊʹޭ ʢଞͷϙδγϣϯ͍͍ײͩͬͨ͡ʣ ޙ͔ͬ͜ΒߋʹΧςΰϦʔྨͯ͠ ʮະདྷͷΛ࡞ΓࠐΉʯ ࣄ͕Ͱ͖ͨΒʂ
ػցֶशλεΫͦͷᶄ ʮಉ͡ΧςΰϦͷબखΛݟ͚ͭΔʯ
φΠʔϒϕΠζʹΑΔΧςΰϦʔ͚ • ࣗવݴޠॲཧͷྨλεΫΈ͍ͨͳղ͖ํͰͬͯΈͨ. • ީิʮφΠʔϒϕΠζʯʮϥϯμϜϑΥϨετʯ͋ͨΓ. ࠓճφΠʔϒϕΠζͰͬͨ. • ٿʹ͓͚Δ౷߹తͳೳྗࢦඪʮOPSʯΛ͝ͱͷΧςΰϦʔʹ͚, ͍͔ͭ͘ͷଧܸࢦඪΛϕΫτϧʹ࣮ͯ͠ࢪ. •
࣮ී௨ʹscikit-learnͱPandasͰΓ·ͨ͠.
ͬͨ͜ͱʢཁʣɹ˞ࡶʹॻ͍ͯ·͢ • ֶशσʔλ • ༧ଌ͍ͨ͠બखʹࣅͨબख50ਓͷΛϐοΫΞοϓ • ಛྔൿີͰ͕͢…ී௨ͷଧܸʹӅ͠ຯগʑ • ༧ଌσʔλ •
༧ଌ͍ͨ͠બखͷಛྔ • ݁Ռͷϥϕϧσʔλ • OPSΛ5ஈ֊ͷΧςΰϦʹͨ͠ͷ(1ʙ5) • ্هͰࢦఆͨ͠ΧςΰϦʹଐ͢Δબखͷྸผฏۉ͔ΒͦΕͬΆ͍Λग़͢
༧ଌͱҰॹʹݟͯΈ·͠ΐ͏͔.
ϚοτɾνϟοϓϚϯʢݱ࣮ͷʣ 24ʙ26ࡀʢڈ·Ͱʣͷ. ༧ଌ͍ͨ͠ͷ27ʙ29ࡀͷ.
ϚοτɾνϟοϓϚϯʢ༧ଌ͖ʣ 27ࡀҎ߱ͷΛ༧ଌͨ݁͠ՌΛؚΊͨάϥϑ.
None
ग़͖ͯͨ݁ՌΛ͡Δͱ… • ൺֱత, ݱ࣮ʹଈͯ͠ΔͬΆ͍݁ՌʹͳΓ·ͨ͠. • ʮ28ࡀͷ͕Maxʯʮ29ࡀ͔ΒԼ͕ͬͯΔʯͨΓ͕ϦΞϧ. ※ΞεϦʔτͷମత࠷ߴை26ʙ28ࡀͱݴΘΕ͍ͯ·͢ • ͱ͍͑28ࡀͷຊྥଧ্͕͕ͬͯΔͷ, ͳΜ͔ո͍͠.
͓ͦΒ͘୭͔ͷʹҾͬுΒΕ͍ͯΔ.
Γ͠ɾվળϙΠϯτ • ࠷ޙͷྨ, ϕΠζҎ֎ࢼ͍ͨ͠. • ʮ28ࡀΛʹਰ͑ΔʯϙδγϣϯʹΑͬͯҧ͏આ͋Δ. ͷͰʮ্ͷʯΛٻΊΔλεΫ͕͍͍͔͋ͬͯ. • 2020ͷϝδϟʔϦʔάྫͷͷࢼ߹ͳͷͰ, ༧ଌͦ͜ʹ߹Θ͍ͤͨʢ2ͰׂͬͯऴΘΔʁwʣ
• ͱ͍͏ͷ͕PyCon JP 2020·ͰʹͰ͖ͯΔͣʢVer. 25ʮTsurageʯͰʣ
ଓ͖PyCon JP 2020Ͱʂ #͓͠·͍ #͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ Shinichi Nakagawa(Twitter/Facebook/etc… @shinyorke)