Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ANNとナイーブベイズを使った雑な野球選手の成績予測 / Baseball player p...
Search
Shinichi Nakagawa
PRO
July 22, 2020
Research
0
3k
ANNとナイーブベイズを使った雑な野球選手の成績予測 / Baseball player performance prediction with Python
PyCon JP 2020で話す予定の話のダイジェストです.
kawasaki.rb #86 での練習試合.
#Python #DataScience #MLB #Baseball
Shinichi Nakagawa
PRO
July 22, 2020
Tweet
Share
More Decks by Shinichi Nakagawa
See All by Shinichi Nakagawa
AI・LLM事業部のSREとタスクの自動運転
shinyorke
PRO
0
410
実践Dash - 手を抜きながら本気で作るデータApplicationの基本と応用 / Dash for Python and Baseball
shinyorke
PRO
2
3k
Terraform, GitHub Actions, Cloud Buildでデータ基盤をProvisioningする / Data Platform provisioning for Google Cloud and Terraform
shinyorke
PRO
2
3.2k
Cloud RunとCloud PubSubでサーバレスなデータ基盤2024 with Terraform / Cloud Run and PubSub with Terraform
shinyorke
PRO
9
4k
自らを強いエンジニアにするための3つの習慣 / I need to be myself, I can't be no one else
shinyorke
PRO
82
85k
阪神タイガース優勝のひみつ - Pythonでシュッと調べた件 / SABRmetrics for Python
shinyorke
PRO
1
1.4k
Pythonとクラウドと野球の推し活. / Baseball Data Platform for Python and Google Cloud
shinyorke
PRO
2
2.9k
月額コーヒー3.34杯分のコストでオオタニサンの活躍を見守るデータ基盤のはなし / Pyhack Con
shinyorke
PRO
2
520
俺のDXを実現するためのサーバレスなデータ基盤開発と運用 / Serverless Data Platform and Baseball
shinyorke
PRO
5
12k
Other Decks in Research
See All in Research
Google Agent Development Kit (ADK) 入門 🚀
mickey_kubo
2
1k
業界横断 副業・兼業者の実態調査
fkske
0
160
Generative Models 2025
takahashihiroshi
21
11k
Principled AI ~深層学習時代における課題解決の方法論~
taniai
3
1.2k
Adaptive fusion of multi-modal remote sensing data for optimal sub-field crop yield prediction
satai
3
210
CSP: Self-Supervised Contrastive Spatial Pre-Training for Geospatial-Visual Representations
satai
3
210
2025年度 生成AIの使い方/接し方
hkefka385
1
700
言語モデルによるAI創薬の進展 / Advancements in AI-Driven Drug Discovery Using Language Models
tsurubee
2
370
クラウドのテレメトリーシステム研究動向2025年
yuukit
3
950
When Submarine Cables Go Dark: Examining the Web Services Resilience Amid Global Internet Disruptions
irvin
0
200
ノンパラメトリック分布表現を用いた位置尤度場周辺化によるRTK-GNSSの整数アンビギュイティ推定
aoki_nosse
0
320
NLP2025参加報告会 LT資料
hargon24
1
320
Featured
See All Featured
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Scaling GitHub
holman
459
140k
A designer walks into a library…
pauljervisheath
207
24k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
8
670
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
The Pragmatic Product Professional
lauravandoore
35
6.7k
Balancing Empowerment & Direction
lara
1
370
For a Future-Friendly Web
brad_frost
179
9.8k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
124
52k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Transcript
ٿબखͷ༧ଌϞσϧΛ ͍͍ײ͡ʹ࡞ͬͯΈͨVer 1.0 Shinichi Nakagawa (@shinyorke) kawasaki.rb #86 7पͪΐͬͱLTେձ
Who am I ? • Shinichi Nakagawa(@shinyorke) • JX௨৴ࣾγχΞɾΤϯδχΞ •
࠷ۙͣͬͱσʔλج൫ɾσʔλੳ͍ͯ͠ΔϚϯ • ຊདྷٿσʔλαΠΤϯεʹڧ͍ਓ • ٕज़ސ͡Ί·ͨ͠
kwsk.pyҊ݅Ͱ͢ :bow: PyCon JPʹ2ͿΓ6ճͷ⽁Λ͢Δ͜ͱʹͳΓ·ͯ͠. ٱ͠ͿΓʹนଧͪʹͬͯ·͍Γ·͓͖ͨ͠߹͍͍ͩ͘͞⽁
ʲਤʳࠓճ͖ͬͯͨ͜ͱ ຊ֨తͳ։ൃ4݄͔Β, ࠷ޙͷλεΫ͕௨ͬͨͷ͕͍ͭ࠷ۙ اըɾߏؚΊΔͱ࣮͍ۙϓϩδΣΫτͩͬͨΓ
None
σʔληοτ࡞ɾಛྔநग़ • ϝδϟʔϦʔάͷσʔλʮSean Lahmanʯʮretrosheetʯ ͜ΕΒΛͯ͢BigQueryʹimport • CSV͔Βςʔϒϧ࡞ • ػցֶशλεΫʹඞཁͳಛྔΛ۪ʹࢉग़
ػցֶशλεΫͦͷᶃ ʮࣅ͍ͯΔબखΫϥελΛ࡞Δʯ
कඋҐஔɾͷงғؾͰΫϥελϦϯά • ࡶʹݴ͏ͱ, ʮ˓˓ͬΆ͍બखϥϯΩϯάʯΛ࡞Δ • ྫ͑ࡔຊ༐ਓʢڊਓʣͬΆ͍બखʁͱݴΘΕͨΒ, ʮकඋҐஔ͕γϣʔτʯʮৗʹ3ׂ20ຊྥଧଧͭʯ ͱ͔ͦΜͳײ͡. γϣʔτͰ͋Δ͜ͱϚετ, ͋ͱଧܸ࣍ୈ.
• ଧܸ͓ΑͼҰ෦ͷकඋࢦඪΛͬͯϢʔΫϦουڑΛ ٻΊͯ૯ΓͰ֤બखͷʮͦΕͬΆ͍ϥϯΩϯάʯΛ࡞Εͦ͏.
ۙࣅ࠷ۙ୳ࡧʢANNʣͰͬͯΈͨ • kNNͱ͔k-meansͱ͔Γํ৭ʑ͚͋ͬͨͲANNͰͬͨ݁Ռ ͕͍͖ͳΓ͍͍ײͩͬͨ͡ͷͰ͜Εʹͨ͠. • ANNͷλεΫAnnoy͍ͬͯ͏ϥΠϒϥϦͰര։ൃ. • ϝδϟʔϦʔΨʔ19,000ਓͷσʔλͰͬͨΒ͍͍ײ͡ʹ.
ίʔυʢҰ෦ൈਮʣ˞ಛྔൿີ ֶश͔ΒϞσϧอଘͨͬͨ͜Ε͚ͩ. σʔλେ͖͘ͳ͍ͷͰඵͰऴΘΓ·ͨ͠.
ϚοτɾνϟοϓϚϯʢMLBएखࡾྥखʣʹ͍ۙબख ٬؍తͳσʔλ͔Β, ϑΝϯͱͯͬͯ͠Δͱͯ͠. ͍ۙબख͕ͪΌΜͱू·Γ·ͨ͠, શһࡾྥखͰଧܸͰ݁Ռग़ͤΔϚϯͳͷͰจ۟ͳ͠ʂ
ࣅ͍ͯΔબखूΊʹޭ ʢଞͷϙδγϣϯ͍͍ײͩͬͨ͡ʣ ޙ͔ͬ͜ΒߋʹΧςΰϦʔྨͯ͠ ʮະདྷͷΛ࡞ΓࠐΉʯ ࣄ͕Ͱ͖ͨΒʂ
ػցֶशλεΫͦͷᶄ ʮಉ͡ΧςΰϦͷબखΛݟ͚ͭΔʯ
φΠʔϒϕΠζʹΑΔΧςΰϦʔ͚ • ࣗવݴޠॲཧͷྨλεΫΈ͍ͨͳղ͖ํͰͬͯΈͨ. • ީิʮφΠʔϒϕΠζʯʮϥϯμϜϑΥϨετʯ͋ͨΓ. ࠓճφΠʔϒϕΠζͰͬͨ. • ٿʹ͓͚Δ౷߹తͳೳྗࢦඪʮOPSʯΛ͝ͱͷΧςΰϦʔʹ͚, ͍͔ͭ͘ͷଧܸࢦඪΛϕΫτϧʹ࣮ͯ͠ࢪ. •
࣮ී௨ʹscikit-learnͱPandasͰΓ·ͨ͠.
ͬͨ͜ͱʢཁʣɹ˞ࡶʹॻ͍ͯ·͢ • ֶशσʔλ • ༧ଌ͍ͨ͠બखʹࣅͨબख50ਓͷΛϐοΫΞοϓ • ಛྔൿີͰ͕͢…ී௨ͷଧܸʹӅ͠ຯগʑ • ༧ଌσʔλ •
༧ଌ͍ͨ͠બखͷಛྔ • ݁Ռͷϥϕϧσʔλ • OPSΛ5ஈ֊ͷΧςΰϦʹͨ͠ͷ(1ʙ5) • ্هͰࢦఆͨ͠ΧςΰϦʹଐ͢Δબखͷྸผฏۉ͔ΒͦΕͬΆ͍Λग़͢
༧ଌͱҰॹʹݟͯΈ·͠ΐ͏͔.
ϚοτɾνϟοϓϚϯʢݱ࣮ͷʣ 24ʙ26ࡀʢڈ·Ͱʣͷ. ༧ଌ͍ͨ͠ͷ27ʙ29ࡀͷ.
ϚοτɾνϟοϓϚϯʢ༧ଌ͖ʣ 27ࡀҎ߱ͷΛ༧ଌͨ݁͠ՌΛؚΊͨάϥϑ.
None
ग़͖ͯͨ݁ՌΛ͡Δͱ… • ൺֱత, ݱ࣮ʹଈͯ͠ΔͬΆ͍݁ՌʹͳΓ·ͨ͠. • ʮ28ࡀͷ͕Maxʯʮ29ࡀ͔ΒԼ͕ͬͯΔʯͨΓ͕ϦΞϧ. ※ΞεϦʔτͷମత࠷ߴை26ʙ28ࡀͱݴΘΕ͍ͯ·͢ • ͱ͍͑28ࡀͷຊྥଧ্͕͕ͬͯΔͷ, ͳΜ͔ո͍͠.
͓ͦΒ͘୭͔ͷʹҾͬுΒΕ͍ͯΔ.
Γ͠ɾվળϙΠϯτ • ࠷ޙͷྨ, ϕΠζҎ֎ࢼ͍ͨ͠. • ʮ28ࡀΛʹਰ͑ΔʯϙδγϣϯʹΑͬͯҧ͏આ͋Δ. ͷͰʮ্ͷʯΛٻΊΔλεΫ͕͍͍͔͋ͬͯ. • 2020ͷϝδϟʔϦʔάྫͷͷࢼ߹ͳͷͰ, ༧ଌͦ͜ʹ߹Θ͍ͤͨʢ2ͰׂͬͯऴΘΔʁwʣ
• ͱ͍͏ͷ͕PyCon JP 2020·ͰʹͰ͖ͯΔͣʢVer. 25ʮTsurageʯͰʣ
ଓ͖PyCon JP 2020Ͱʂ #͓͠·͍ #͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ Shinichi Nakagawa(Twitter/Facebook/etc… @shinyorke)