Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ANNとナイーブベイズを使った雑な野球選手の成績予測 / Baseball player p...
Search
Shinichi Nakagawa
July 22, 2020
Research
0
2.9k
ANNとナイーブベイズを使った雑な野球選手の成績予測 / Baseball player performance prediction with Python
PyCon JP 2020で話す予定の話のダイジェストです.
kawasaki.rb #86 での練習試合.
#Python #DataScience #MLB #Baseball
Shinichi Nakagawa
July 22, 2020
Tweet
Share
More Decks by Shinichi Nakagawa
See All by Shinichi Nakagawa
実践Dash - 手を抜きながら本気で作るデータApplicationの基本と応用 / Dash for Python and Baseball
shinyorke
2
1.1k
Terraform, GitHub Actions, Cloud Buildでデータ基盤をProvisioningする / Data Platform provisioning for Google Cloud and Terraform
shinyorke
2
2.8k
Cloud RunとCloud PubSubでサーバレスなデータ基盤2024 with Terraform / Cloud Run and PubSub with Terraform
shinyorke
10
2.8k
自らを強いエンジニアにするための3つの習慣 / I need to be myself, I can't be no one else
shinyorke
77
58k
阪神タイガース優勝のひみつ - Pythonでシュッと調べた件 / SABRmetrics for Python
shinyorke
1
1.3k
Pythonとクラウドと野球の推し活. / Baseball Data Platform for Python and Google Cloud
shinyorke
2
2.7k
月額コーヒー3.34杯分のコストでオオタニサンの活躍を見守るデータ基盤のはなし / Pyhack Con
shinyorke
2
460
俺のDXを実現するためのサーバレスなデータ基盤開発と運用 / Serverless Data Platform and Baseball
shinyorke
5
11k
機械学習エンジニアが目指すキャリアパスとその実話 / My Journey to Become a ML Engineer
shinyorke
9
16k
Other Decks in Research
See All in Research
大規模言語モデルを用いた日本語視覚言語モデルの評価方法とベースラインモデルの提案 【MIRU 2024】
kentosasaki
2
520
研究の進め方 ランダムネスとの付き合い方について
joisino
PRO
55
19k
新規のC言語処理系を実装することによる 組込みシステム研究にもたらす価値 についての考察
zacky1972
0
120
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
240
Composed image retrieval for remote sensing
satai
1
100
機械学習でヒトの行動を変える
hiromu1996
1
300
VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding
sansan_randd
1
240
Isotropy, Clusters, and Classifiers
hpprc
3
630
第79回 産総研人工知能セミナー 発表資料
agiats
2
160
Language is primarily a tool for communication rather than thought
ryou0634
4
740
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
510
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
5
650
Featured
See All Featured
It's Worth the Effort
3n
183
27k
Side Projects
sachag
452
42k
How To Stay Up To Date on Web Technology
chriscoyier
788
250k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
250
21k
Happy Clients
brianwarren
98
6.7k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Building Your Own Lightsaber
phodgson
103
6.1k
A better future with KSS
kneath
238
17k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
6.9k
Code Reviewing Like a Champion
maltzj
520
39k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
31
2.7k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
0
89
Transcript
ٿબखͷ༧ଌϞσϧΛ ͍͍ײ͡ʹ࡞ͬͯΈͨVer 1.0 Shinichi Nakagawa (@shinyorke) kawasaki.rb #86 7पͪΐͬͱLTେձ
Who am I ? • Shinichi Nakagawa(@shinyorke) • JX௨৴ࣾγχΞɾΤϯδχΞ •
࠷ۙͣͬͱσʔλج൫ɾσʔλੳ͍ͯ͠ΔϚϯ • ຊདྷٿσʔλαΠΤϯεʹڧ͍ਓ • ٕज़ސ͡Ί·ͨ͠
kwsk.pyҊ݅Ͱ͢ :bow: PyCon JPʹ2ͿΓ6ճͷ⽁Λ͢Δ͜ͱʹͳΓ·ͯ͠. ٱ͠ͿΓʹนଧͪʹͬͯ·͍Γ·͓͖ͨ͠߹͍͍ͩ͘͞⽁
ʲਤʳࠓճ͖ͬͯͨ͜ͱ ຊ֨తͳ։ൃ4݄͔Β, ࠷ޙͷλεΫ͕௨ͬͨͷ͕͍ͭ࠷ۙ اըɾߏؚΊΔͱ࣮͍ۙϓϩδΣΫτͩͬͨΓ
None
σʔληοτ࡞ɾಛྔநग़ • ϝδϟʔϦʔάͷσʔλʮSean Lahmanʯʮretrosheetʯ ͜ΕΒΛͯ͢BigQueryʹimport • CSV͔Βςʔϒϧ࡞ • ػցֶशλεΫʹඞཁͳಛྔΛ۪ʹࢉग़
ػցֶशλεΫͦͷᶃ ʮࣅ͍ͯΔબखΫϥελΛ࡞Δʯ
कඋҐஔɾͷงғؾͰΫϥελϦϯά • ࡶʹݴ͏ͱ, ʮ˓˓ͬΆ͍બखϥϯΩϯάʯΛ࡞Δ • ྫ͑ࡔຊ༐ਓʢڊਓʣͬΆ͍બखʁͱݴΘΕͨΒ, ʮकඋҐஔ͕γϣʔτʯʮৗʹ3ׂ20ຊྥଧଧͭʯ ͱ͔ͦΜͳײ͡. γϣʔτͰ͋Δ͜ͱϚετ, ͋ͱଧܸ࣍ୈ.
• ଧܸ͓ΑͼҰ෦ͷकඋࢦඪΛͬͯϢʔΫϦουڑΛ ٻΊͯ૯ΓͰ֤બखͷʮͦΕͬΆ͍ϥϯΩϯάʯΛ࡞Εͦ͏.
ۙࣅ࠷ۙ୳ࡧʢANNʣͰͬͯΈͨ • kNNͱ͔k-meansͱ͔Γํ৭ʑ͚͋ͬͨͲANNͰͬͨ݁Ռ ͕͍͖ͳΓ͍͍ײͩͬͨ͡ͷͰ͜Εʹͨ͠. • ANNͷλεΫAnnoy͍ͬͯ͏ϥΠϒϥϦͰര։ൃ. • ϝδϟʔϦʔΨʔ19,000ਓͷσʔλͰͬͨΒ͍͍ײ͡ʹ.
ίʔυʢҰ෦ൈਮʣ˞ಛྔൿີ ֶश͔ΒϞσϧอଘͨͬͨ͜Ε͚ͩ. σʔλେ͖͘ͳ͍ͷͰඵͰऴΘΓ·ͨ͠.
ϚοτɾνϟοϓϚϯʢMLBएखࡾྥखʣʹ͍ۙબख ٬؍తͳσʔλ͔Β, ϑΝϯͱͯͬͯ͠Δͱͯ͠. ͍ۙબख͕ͪΌΜͱू·Γ·ͨ͠, શһࡾྥखͰଧܸͰ݁Ռग़ͤΔϚϯͳͷͰจ۟ͳ͠ʂ
ࣅ͍ͯΔબखूΊʹޭ ʢଞͷϙδγϣϯ͍͍ײͩͬͨ͡ʣ ޙ͔ͬ͜ΒߋʹΧςΰϦʔྨͯ͠ ʮະདྷͷΛ࡞ΓࠐΉʯ ࣄ͕Ͱ͖ͨΒʂ
ػցֶशλεΫͦͷᶄ ʮಉ͡ΧςΰϦͷબखΛݟ͚ͭΔʯ
φΠʔϒϕΠζʹΑΔΧςΰϦʔ͚ • ࣗવݴޠॲཧͷྨλεΫΈ͍ͨͳղ͖ํͰͬͯΈͨ. • ީิʮφΠʔϒϕΠζʯʮϥϯμϜϑΥϨετʯ͋ͨΓ. ࠓճφΠʔϒϕΠζͰͬͨ. • ٿʹ͓͚Δ౷߹తͳೳྗࢦඪʮOPSʯΛ͝ͱͷΧςΰϦʔʹ͚, ͍͔ͭ͘ͷଧܸࢦඪΛϕΫτϧʹ࣮ͯ͠ࢪ. •
࣮ී௨ʹscikit-learnͱPandasͰΓ·ͨ͠.
ͬͨ͜ͱʢཁʣɹ˞ࡶʹॻ͍ͯ·͢ • ֶशσʔλ • ༧ଌ͍ͨ͠બखʹࣅͨબख50ਓͷΛϐοΫΞοϓ • ಛྔൿີͰ͕͢…ී௨ͷଧܸʹӅ͠ຯগʑ • ༧ଌσʔλ •
༧ଌ͍ͨ͠બखͷಛྔ • ݁Ռͷϥϕϧσʔλ • OPSΛ5ஈ֊ͷΧςΰϦʹͨ͠ͷ(1ʙ5) • ্هͰࢦఆͨ͠ΧςΰϦʹଐ͢Δબखͷྸผฏۉ͔ΒͦΕͬΆ͍Λग़͢
༧ଌͱҰॹʹݟͯΈ·͠ΐ͏͔.
ϚοτɾνϟοϓϚϯʢݱ࣮ͷʣ 24ʙ26ࡀʢڈ·Ͱʣͷ. ༧ଌ͍ͨ͠ͷ27ʙ29ࡀͷ.
ϚοτɾνϟοϓϚϯʢ༧ଌ͖ʣ 27ࡀҎ߱ͷΛ༧ଌͨ݁͠ՌΛؚΊͨάϥϑ.
None
ग़͖ͯͨ݁ՌΛ͡Δͱ… • ൺֱత, ݱ࣮ʹଈͯ͠ΔͬΆ͍݁ՌʹͳΓ·ͨ͠. • ʮ28ࡀͷ͕Maxʯʮ29ࡀ͔ΒԼ͕ͬͯΔʯͨΓ͕ϦΞϧ. ※ΞεϦʔτͷମత࠷ߴை26ʙ28ࡀͱݴΘΕ͍ͯ·͢ • ͱ͍͑28ࡀͷຊྥଧ্͕͕ͬͯΔͷ, ͳΜ͔ո͍͠.
͓ͦΒ͘୭͔ͷʹҾͬுΒΕ͍ͯΔ.
Γ͠ɾվળϙΠϯτ • ࠷ޙͷྨ, ϕΠζҎ֎ࢼ͍ͨ͠. • ʮ28ࡀΛʹਰ͑ΔʯϙδγϣϯʹΑͬͯҧ͏આ͋Δ. ͷͰʮ্ͷʯΛٻΊΔλεΫ͕͍͍͔͋ͬͯ. • 2020ͷϝδϟʔϦʔάྫͷͷࢼ߹ͳͷͰ, ༧ଌͦ͜ʹ߹Θ͍ͤͨʢ2ͰׂͬͯऴΘΔʁwʣ
• ͱ͍͏ͷ͕PyCon JP 2020·ͰʹͰ͖ͯΔͣʢVer. 25ʮTsurageʯͰʣ
ଓ͖PyCon JP 2020Ͱʂ #͓͠·͍ #͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ Shinichi Nakagawa(Twitter/Facebook/etc… @shinyorke)