Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BigQueryとPythonではじめるプロ野球選手の成績予測(もしくは成績占い) / Baseball Player Performance Prediction using BigQuery and Python
Search
Shinichi Nakagawa
May 27, 2022
Research
0
3.6k
BigQueryとPythonではじめるプロ野球選手の成績予測(もしくは成績占い) / Baseball Player Performance Prediction using BigQuery and Python
Baseball Play Study mini 2022/5/27 登壇資料
Shinichi Nakagawa
May 27, 2022
Tweet
Share
More Decks by Shinichi Nakagawa
See All by Shinichi Nakagawa
Terraform, GitHub Actions, Cloud Buildでデータ基盤をProvisioningする / Data Platform provisioning for Google Cloud and Terraform
shinyorke
2
2.1k
Cloud RunとCloud PubSubでサーバレスなデータ基盤2024 with Terraform / Cloud Run and PubSub with Terraform
shinyorke
8
2.1k
自らを強いエンジニアにするための3つの習慣 / I need to be myself, I can't be no one else
shinyorke
76
53k
阪神タイガース優勝のひみつ - Pythonでシュッと調べた件 / SABRmetrics for Python
shinyorke
1
990
Pythonとクラウドと野球の推し活. / Baseball Data Platform for Python and Google Cloud
shinyorke
2
2.3k
月額コーヒー3.34杯分のコストでオオタニサンの活躍を見守るデータ基盤のはなし / Pyhack Con
shinyorke
2
390
俺のDXを実現するためのサーバレスなデータ基盤開発と運用 / Serverless Data Platform and Baseball
shinyorke
5
11k
機械学習エンジニアが目指すキャリアパスとその実話 / My Journey to Become a ML Engineer
shinyorke
6
14k
一人でも小さく始められるGoogle Cloudで実現するほぼサーバレスなデータ基盤 / Serverless Dataplatform for Google Cloud
shinyorke
0
450
Other Decks in Research
See All in Research
Breaking Tradeoffs: Extremely Scalable Multi-Agent Pathfinding Algorithms
kei18
0
150
生成AIを用いたText to SQLの最前線
masatoto
1
2.6k
CVPR2023 EarthVision Workshopより衛星画像関連論文紹介 / Satellite Imaging Processing Papers in CVPR2023 EarthVision Workshop
nttcom
0
130
Prompt Tuning から Fine Tuning への移行時期推定
icoxfog417
17
7.1k
インタビューだけじゃない!ユーザーに共感しユーザーの目👀を手に入れるためのインプット
moco1013
0
280
LLMマルチエージェントを俯瞰する
masatoto
26
16k
機械学習と最適化の融合動的ロットサイズ決定問題を例として
mickey_kubo
2
280
The Theory behind Vector DB
matsui_528
0
2.1k
Generative Spoken Dialogue Language Modeling [対話論文読み会@電通大]
yuta0306
1
140
サウナでのプロジェクションマッピングの可能性の検討 / EC71koizumi
yumulab
0
220
データで診て考える合志市の渋滞と公共交通 ~めざせ 車1割削減、渋滞半減、公共交通2倍~
trafficbrain
0
480
Refactoring Mining - The key to unlock software evolution
tsantalis
0
290
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
33
12k
A Modern Web Designer's Workflow
chriscoyier
689
190k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
242
1.2M
A Tale of Four Properties
chriscoyier
153
22k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
660
120k
Building Flexible Design Systems
yeseniaperezcruz
320
37k
Designing with Data
zakiwarfel
96
4.8k
Six Lessons from altMBA
skipperchong
22
3k
GitHub's CSS Performance
jonrohan
1025
450k
Testing 201, or: Great Expectations
jmmastey
30
6.4k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
12
1k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
104
6.6k
Transcript
ಥવͰ͕͢””͍͍ͬͯͰ͔͢? Shinichi Nakagawa@shinyorke Baseball Play Study mini 2022/05/27
ຊͷςʔϚʮٿͱAIͱٕज़ʯ • ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεͱΞϧΰϦζϜ • ٿAIΛࢧ͑Δٕज़ - PythonͱGoogle CloudΛఴ͑ͯ • ٿAIͰ͍·͢,
ʮਪ͠ͷબखͷ5ઌʯ ͖͏ͷਓೳΛ࡞ͬͨͷͰҰॹʹ༡΅͏ͥ⽁ʢཁʣ
ࠓճͷ͍ʮଧऀͷʯͰ͢ खVer.ແ͘ͳ͍Ͱ͕͢, ݁Ռ͕ඍົͩͬͨͷͰଧऀͷΈͰΒ͍͖ͤͯͨͩ·͢🙏
Who am I ?ʢ͓લ୭Αʣ • Shinichi Nakagawaʢத ৳Ұʣ • େͷSNSͰʮshinyorkeʢ͠ΜΑʔ͘ʣʯͱ໊͍ͬͯ·͢
• ΞΫηϯνϡΞגࣜձࣾϚωʔδϟʔʢຊۀʣ • ຊۀͷํͰʮGoogle Cloudڧ͍ϚϯʯతͳཱͪҐஔͰ ιϦϡʔγϣϯΞʔΩςΫτʢSRE/DevOpsपΓʣ • ݸਓ׆ಈʮੜͷٿσʔλαΠΤϯςΟετʯͱͯ͠ ٿʹؔ͢ΔσʔλαΠΤϯεͱΤϯδχΞϦϯάΛ͍ͯ͠·͢ ʢ͔ͭ, ຊۀͰػցֶशΤϯδχΞɾσʔλαΠΤϯςΟετܦݧ͋Γʣ • ւಓຊϋϜϑΝΠλʔζ&ΦʔΫϥϯυɾΞεϨνοΫεͷϑΝϯ⽁
ຊͷଧॱ • ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεೖ • ٿAIΛ࣮͢Δ - Google CloudΛఴ͑ͯ • ಥવͰ͕͢””͍͍ͬͯͰ͔͢⽁
- ٿAIͰ
ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεೖ
ٿAIΛࢧ͑ΔηΠόʔϝτϦΫε • ηΠόʔϝτϦΫε #ͱ • ηΠόʔϝτϦΫεͷ͖΄Μ • ʮͦͬ͘Γ͞Μʯ͔Β༧ଌ - PECOTAϞσϧ
• shinyorke’s༧ଌϞσϧʮzobristʯվΊʮkenshiʯ શ෦͢ͱ3.34͔͔࣌ؒΔͷͰࠓ֓ཁͷΈհ🐯
ηΠόʔϝτϦΫε #ͱ • ٿʹ͓͍ͯൃੜ͢ΔσʔλΛ౷ܭֶతͳΞϓϩʔνͰੳΛߦ͍, ʮબखͷೳྗʯʮνʔϜͷڧ͞ʯͳͲநతͳ֓೦ΛఆྔతʹࢦඪԽ͠, νʔϜɾબखɾϑΝϯʹཱͯΔͨΊͷՊֶతͳΞϓϩʔνɾߟ͑ํͷ͜ͱ. • Ҏલσʔλ͕ओྲྀ͕ͩͬͨ,
ʮελοτΩϟετʯʮτϥοΫϚϯʯͱ͍ͬ ͨ, ܭଌػثτϥοΩϯάσʔλΛ༻͍ͯߦ͏ͷ͕ࠓͷτϨϯυ • ͳ͓, σʔλͷΈͰे͗͢Δ͙Β͍໘ന͍ࣄ͕ग़དྷ·͢ ʢ㲈τϥοΩϯάσʔλٿɾٕज़ڞʹઐ͕ࣝΘΕΔ&қߴ͍ʣ
ηΠόʔϝτϦΫεͷ͖΄Μ • ηΠόʔϝτϦΫεγϯϓϧͳ࢛ଇԋࢉ͓Αͼ౷ܭͰߦ͏ࣄ͕Ͱ͖Δ • Α͘ΒΕ͍ͯΔʮOPSʯʮWHIPSʯͳͲ, ࣜͦͷͷిExcelͰܭࢉ͕Մೳʢ㲈ϓϩάϥϛϯάෆཁʣ • Ұํ, ʮWARʯʮRCʯͳͲͷࢦඪܭࢉׂ͕ͱෳࡶ,
ExcelͰग़དྷͳ͘ແ͍͕, ϓϩάϥϛϯάSQL, ػցֶशͳͲͰॲཧͨ͠΄͏͕ྑ͍ύλʔϯଘࡏ͢Δ. • ༧ଌʮಛྔΤϯδχΞϦϯάʯͱͯ͠ѻ͏ͱ࣮ݱ͢Δ͜ͱ͕Ͱ͖Δʂ ʢͱ͍͏ͷ͕͜ͷൃදͷٕज़తͳςʔϚͰ͢ʣ
ٿσʔλΛಛྔʹม͢Δ ಛྔʢ㲈ʣʹมɾ୯ҐΛἧ͑Δಓͳ࡞ۀ͕ඞཁ • -> • ͦͷ··͑ΔϞϊ͕ଟ͍. ྫ͑҆ଧ, ࢛ٿ,
ࡾৼͳͲ. • Θ͔Γ͍͢୯Ґʹਖ਼نԽɾεέʔϦϯά͢Δ. RC, wRAA, wOBAͳͲͷηΠόʔϝτϦΫεࢦඪ. • Ҏ֎ͷσʔλ -> • ར͖ଧ੮ͷࠨӈ, ఱવࣳ or ਓࣳ, ֎ or υʔϜ or େࣗવʢॴͱݴ͍ͬͯͳ͍ʣ? • Ͱແ͍σʔλΛಛྔʹ͢ΔͨΊͷॲཧ͕ඞཁʢΧςΰϦʔʹ͢ΔͳͲʣ
ϓϩٿબखͷΛ͏ٕज़ • ༧ଌͦͷͷηΠόʔϝτϦΫεᴈ໌ظ͔Β͋Δఆ൪ωλͰ, ΞϝϦΧʹϑΝϯ͚ͷ༧ଌαΠτ͕͋Δ͙Β͍ͷΓ্͕Γ. • τϥοΩϯάσʔλ͕ओྲྀͷࠓͰબखͷ݈߁ཧύϑΥʔϚϯε ଌఆͳͲΛ௨ͯ͡কདྷͷύϑΥʔϚϯεΛ༧ଌ͢Δ͜ͱ. ※༧ଌͷݱ׆༻,
ͱݴ͑ΔʢPlayer’s Developmentʣ • ݹయత͔ͭදతͳ༧ଌϞσϧͱͯ͠, PECOTAʢϖίλʣ͕༗໊.
PECOTA - ࠷౷ܭతͳ༧ଌϞσϧ • 2003ʢ19લʣʹϦϦʔεͨ͠MLBͷ༧ଌϞσϧ • ʮաڈͷࣅ͍ͯΔબखͷʯ͔Β༧ଌΛࢉग़ ͳ͓۩ମతͳख๏ɾࣜඇެ։ʢߟ͑ํͪΒ΄Βॻ͍ͯ͋Δʣ •
ޙʹ2008ถࠃେ౷ྖબڍͷউऀΛ49/50भతதͤͨ͞ ౷ܭֶऀωΠτɾγϧόʔ͕։ൃ ※ؾʹͳΔํʮγάφϧ&ϊΠζʯͱ͍͏ॻ੶ΛಡΜͰ͍ͩ͘͞
ʮͦͬ͘Γ͞ΜʯΛ୳͢ࣄͰΛ༧ଌͰ͖Δ!? աڈϝδϟʔϦʔάͰσϏϡʔͨ͠બख2021·Ͱʹ20, 370ਓ͍ΔʢLahman’s Baseball Databaseௐʣ ͜Ε͚͍ͩΕ, ʮੲͷ͋ͷਓͬΆ͍ʯ͙Β͍ग़ͤΔͷͰͳ͔Ζ͏͔???
shinyorke’s༧ଌϞσϧʮkenshiʯര • աڈʢؚΉݱʣʹଘࡏͨ͠ٿબखͷΛݩʹ, ʮࣅ͍ͯΔબखΛΫϥελϦϯάʯ Ͱ͖ͨΒ༧ଌ࡞ΕΔͷͰ? -> ࣮PECOTA͜ͷΞϓϩʔνʢ࠷ॳظʣ • ηΠόʔϝτϦΫεͰʮྨࣅੑείΞʯͱ͍͏ࣅ͍ͯΔબखΛಋ͕ࣜ͋͘Δ͕,
೦ͳ͕Β͕ܽଟ͍ʢ௨ࢉͰΫϥελϦϯά͢ΔͨΊ, όΠΞε͕ڧ͘ग़Δʣ • ʮ͋ΔಛྔΛݩʹΫϥελϦϯάʯಛྔΤϯδχΞϦϯά͕ಘҙͳλεΫ ػցֶशతͳΞϓϩʔνͰߦ͚ΔͷͰ?આ -> Ͱ͖ͨ🙌 • ϝδϟʔϦʔά൛AIʮzobristʯΛ։ൃ -> ͍͍ײͩͬͨ͡ͷͰຊϓϩٿ൛Λ࡞ˡࠓ͜͜ ͜͏ͯ͠, shinyorke’sϓϩٿ༧ଌϞσϧ&ٿAIʮkenshiʯ͕ര.
ٿAIΛ࣮͢Δ - Google CloudΛఴ͑ͯ
ٿAIʮkenshiʯΛ࣮͢Δ • ΞʔΩςΫνϟͷશମ૾ • σʔλऔಘͱલॲཧ • ΞϧΰϦζϜΛܾΊͯΫϥελϦϯά • ༧ଌΛ፻͢Δੜ͢Δ ͪͳΈʹkenshi໊ͬͯલͷ༝དྷӈ྆ଧͷ͋ͷબखΑΓʢࠢʣ
ϓϩٿબख༧ଌϓϩμΫτશମ૾
ΞʔΩͷجຊํ • σʔλͯ͢BigQueryʹूΊΔʢ㲈Google CloudͰͯ͢ΛݻΊͨཧ༝ʣ • ֶशσʔλςετσʔλͯ͢BQ • ޙड़͢ΔલॲཧɾσʔλཧΛͳΔ͘SQLͰΓ͔ͨͬͨ • αʔόϨεͳαʔϏεΛத৺ʹબΜͰ͏ʢ㲈VMͰ͋Δඞཁ͕ແ͍ʣ
• ΞϓϦΫϩʔϥʔCI/CDαʔόϨεܥͷαʔϏεͰݻΊΔ • ʮͬͨʯ͚ͩඅ༻ʹͳΔͷͰࡒʹ༏͍͠&εέʔϦϯάָ
αϥοͱղઆ • Data Analytics • BigQuery͕ͯ͢ͷத৺, σʔλͯ͢͜͜ • Cloud ConsoleͰΫΤϦʔΛॻ͍ͯσʔληοτ࡞,
͍͠λεΫJupyter Lab্Ͱ࣮ࢪ • ωοτ͔Βऩू͢ΔσʔλʢCSVʣCloud Storageʹอଘ, Cloud FunctionsΛͬͯBigQueryʹExport • Web App • StreamlitʢޙͰղઆʣͰ࣮ͨ͠ΞϓϦΛCloud RunͰϗετ • CI/CDGitHub ActionsͰαΫοͱ
ϗϯτʹࡉ͔͍ٕज़ղઆϒϩάͰ https://shinyorke.hatenablog.com/entry/cloud-arch-serverless ࠓճͷൃද༻ͷ͓ֆ͔͖Ͱ͕ͨ͠ϒϩάͰόζͬͨ&ผͰৄͤ͘͠Εʂ
σʔλͷऔಘ • ֶशσʔλϝδϟʔϦʔάͷσʔλΛ༻ • Lahman’s Baseball Database • ্هσʔλϕʔεͷCSVσʔλΛBigQueryʹimport •
ϓϩٿͷσʔλBaseball Reference͔ΒεΫϨΠϐϯά • 2021γʔζϯऴྃ࣌ΛݩʹεΫϨΠϐϯά • Pythonͷrequests-htmlͰΫϩʔϥʔΛ࣮, CSVอଘ -> BigQuery
ϝδϟʔϦʔάͷσʔλΛͬͨཧ༝ • ຊͷϓϩٿͰ·ͱ·ͬͨσʔληοτ͕ଘࡏ͠ͳ͍ • ͋Δॴʹ͋Δ͕, ݖརతʹ͑Δ͔ո͍͠ • ϝδϟʔϦʔάΦʔϓϯσʔλ͕ॆ࣮͔ͭݖརେৎ • αϯϓϧσʔλͷେ͖͞ʢ100Ҏ্͋ΔͷͰे͗͢Δʣ
• ಉ͡ٿͱ͍͏ڝٕ͔ͭهมΘΒͳ͍ͷͰӨڹগͳ͍ͱஅ
લॲཧ • ֶशʹඞཁͳσʔλSQLͰՃ, Viewʹͯ͠อଘ →Google Cloud ConsoleͰ࣮ࢪ • Ͳ͏ͯ͠SQLͰ໘͍͘͞ͷΛPandasͳͲͰॲཧ
→ࣗͷPC্ʹ࡞ͬͨJupyter LabڥͰ࣮ࢪ • ֶशʹඞཁͳ௨ࢉɾผΛࢉग़͢ΔͨΊͷ ΫΤϦʔσʔληοτΛͻͨ͢Β࡞Γ·ͬͨ͘
લॲཧͷྫ - SQLͰߦ͏ٿͷಛྔநग़ • ଧ, ग़ྥ, OPSతͳͷ SQLͰܭࢉͰ͖Δ. •
͏ͪΐͬͱෳࡶͳࢦඪ. ྫ͑wOBAͱ͔. • ্هBigQueryͰ݁͠·ͨ͠.
લॲཧͷྫ - SQLͰߦ͑ͳ͍ͷ? • ࡶͳॲཧɾܭࢉ͕ೖͬͨΓ, ߦྻͰ·ͱ·ͬͨϞϊͷॲཧ PythonRͰॲཧ͕ϕετ. •
ྫ͑ϐϘοτςʔϒϧ, άϧʔϐϯάͳͲPandasͰ ॻ͍ͨ΄͏͕Θ͔Γ͍͢ ͱ͖͋Δʢॾઆ͋Γ·͢ʣ • SQL͕ۤखͳํશ෦ͬͪ͜Ͱͬͯྑ͍͔.
ΞϧΰϦζϜΛܾΊͯΫϥελϦϯά • ʮࣅ͍ͯΔબखʯΛྨ͢ΔλεΫ • ΞϧΰϦζϜΛܾΊΔˠ࠷ऴతʹANNʹ • AnnoyʢΞϊΠʔʣͰരANN ྨλεΫΛ࡞Γ, ςετΛॻ͖, γϡοͱCIͰ࠶࣮ߦՄೳʹ.
ࣅ͍ͯΔબखΛ୳͢ɾྨ͢Δ • ௨ࢉͱकඋҐஔ͝ͱͷग़ճΛಛྔͱ͢Δ͜ͱʹΑΓ, ʮࣅ͍ͯΔબखʯΛ୳͢͜ͱ͕ՄೳͳͷͰ? • ಛྔΛͬͯΫϥελϦϯάͯ͠ڑΛܭଌ, ͍ۙॱͰϥϯΩϯάԽ͢ΔʢϢʔΫϦουڑͳͲͰʣ •
ͳ͓, PECOTAʢ͓ͦΒ͘ʣߟ͑ํಉ͡.
ANNʢۙࣅ࠷ۙ୳ࡧʣΛ࠾༻ • ग़ࢼ߹, ଧ੮, ओཁͳଧܸʢ҆ଧ, ຊྥଧ, ଧ, etc…ʣ • कඋҐஔʢશ9ϙδγϣϯ,
DHߟྀ͠ͳ͍ʣผͷग़ճ • ্هΛಛྔͱͯ͠ANNʢۙࣅ࠷ۙ୳ࡧʣΛ͔ͭͬͯ ϢʔΫϦουڑΛࢉग़͠, ͍ۙબखΛूΊΔ͜ͱʹ. • ʮAIʹΑΔࣆδϟύϯબग़ʯͱ͍͏ωλͰར༻->݁Ռ্ʑ https://shinyorke.hatenablog.com/entry/tokyo2020-samurai-japan • ࣮Annoyͱ͍͏ศརͳϥΠϒϥϦΛ͍·ͨ͠.
AnnoyΛͬͨANNʹΑΔΫϥελϦϯά. ूΊͨσʔλΛ͠ࠐΜͰΔ͜ͱͰΫϥελϦϯά͕Ͱ͖·ͨ͠.
݁ՌΛݟͯΈͨ • ΦϦοΫε٢ాਖ਼ঘʹࣅ͍ͯΔਓΛ୳͢ • ༧ଌϞσϧʹ٢ాਖ਼ঘͷΛͯ͠ ΫϥελϦϯά݁ՌΛௐࠪ • ϋϯΫɾΞʔϩϯ, ΟϦʔɾϝΠζ,
ήϨʔϩଞ, ࣅ͍ͯΔ֎ख͕औΕͨͷͰ ޭͱݴ͑ͦ͏🎉 ※ήϨʔϩڈΦΦλχαϯͱHRԦ૪͍ͨ͠ήϨʔϩJr.ͷ͓͞Μ
༧ଌͷग़͠ํ • ΫϥελϦϯάͷ݁Ռ, ্ҐʹϥϯΩϯά͞Εͨબखͷ ྸผΛऔಘ • ྸผͷฏۉύʔηϯλΠϧΛࢼͯ͠, ऩ·Γͷྑ͍ࣈʹ͢Δ
• ଧɾ҆ଧͳͲʮੵΈॏͶʯͷΛ༧ଌޙ, ଧͳͲͷʮʯΛද͢Λܭࢉ
ϓϩμΫτʹ͢Δ • ͻͱ·࣮ͣݧతͳΞϓϦέʔγϣϯΛ StreamlitͰ࣮ • StreamlitҰݴͰݴ͏ͱ ʮJupyter notebookΛΞϓϦʹ͢Δʯ
ͨΊͷFramework • Dockerίϯςφʹͯ͠ Cloud RunͰϗεςΟϯά
ಥવͰ͕͢””͍͍ͬͯͰ͔͢?
AIͰ͏ʮࠓ, ؾʹͳΔϓϩٿબखʯ • ݱࡏઈௐ, ޥͷ͋ͷਓ • ೋ಄ཽʢೋྲྀʣͤ͞Δඞཁ͋Δͷ͔ແ͍ͷ͔? • BIG BOSSʹࣅͯΔʢ͔͠Εͳ͍ʣ͋ͷબख
ຊ12ٿஂ৮Ε͍ͨ…Ͱ͕࣌ؒ͢ͷ߹ʹΑΓ🙏
ઈௐͳޥͷ͋ͷਓͱ͍͑ • ࡔ কޗʢౡʣ - 2016υϥϑτ4Ґ • ࡢ͍ͭʹϒϨΠΫ, ࠓ͜͜·Ͱଧരൃ •
ϝΠϯัख͕ͩकΕΔϢʔςΟϦςΟ
͜ΕΤά͍ະདྷ༧ਤʢੌʣ
ࡔ কޗબखͷະདྷ • ࠓͷ༧ʮଧ.309 ຊྥଧ20ຊ ଧ70 OPS .903ʯ • ڈͷงғؾ͔Β͢ΔͱϦΞϧʹୡՄೳͳ༧ײ͕!?
• ݸਓతʹͬͺัखͬͯ΄͍͠, νʔϜࣄͳΜ͚ͩΕͲ ʢଧͯΔัख͍Δ͚ͩͰΞυόϯςʔδେ͖͍ʣ
ཽͷະདྷΛ͏ - ೋਓͷཽઓ࢜ • AɾϚϧςΟωεʢதʣ - 2018ೖஂ • ࠜඌ ߉ʢதʣ
- 2018υϥϑτ1Ґ • ଧ͓ΑͼೋྲྀͰͪΐͬͱΛݺΜͰ͍ΔೋਓΛ͏
ཽͷະདྷ໌Δ͍͔?
AɾϚϧςΟωεબखͷະདྷ • ࠓͷ༧ʮଧ.290 ຊྥଧ10ຊ ଧ44 OPS .862ʯ • OPSҎ֎ຊؾͰୟ͖ग़ͦ͠͏ͳࣈͳؾ͕͢Δ? •
ཉΛݴ͑֎͡Όͳͯ͘ัखͰग़ͯ΄͍͠ ัखͰ͜Ε͚ͩଧͬͨΒࠓͷٿͩͱੌ͍͜ͱʹ
ͳΔ΄Ͳ?
ࠜඌ ߉બखͷະདྷ • ࠓͷ༧ʮଧ.244 ຊྥଧ1ຊ ଧ6 OPS .654ʯ 5ޙ·Ͱͷ༧ଌ…͏ʔʔΜ?
• ඇৗʹौ͍ධՁ, ೋྲྀΛࢼ͢ҙຯ༧ଌ͚ͩͩͱ͋Γͦ͏? • ൩ܕͱ৴͍ͨ͡, ͍͘ΒͳΜͰٿAIͷධՁ͕ौ͗͢? ͪͳΈʹ౻ݪ ګେʢϩοςʣͳ͔ͳ͔ौ͍ධՁʹ
BIG BOSSͷޙܧऀ୭ͩ? • ສ தਖ਼ʢຊϋϜʣ - 2018υϥϑτ4Ґ • ύϫʔͱεϐʔυ, ࡶ͞Λ݉Ͷἧ͑ͨϑΟδΧϧϞϯελʔ
ϑϧεΠϯάͰ͔ͬඈ͢ଧܸͱڧݞΛੜ͔ͨ͠कඋ ݱ࣌ͷBIG BOSSͦͷͷ • ࢲ, shinyorke͕ࠓ࠷ਪ͍ͯ͠Δϓϩٿબख
ࢥͬͨΑΓBIG BOSSͬΆ͞?
ສ தਖ਼બखͷະདྷ • ࠓͷ༧ʮଧ.252 ຊྥଧ18ຊ ଧ52 OPS .780ʯ • ϗϯτʹୟ͖ग़ͦ͠͏ͳࣈ,
ग़ػձ&ଧ࣍ୈͰ ͳΜͩͬͨΒຊྥଧ༧ଌ௨Γ͔ͨ͠͠Β͔͢? • 5ޙʹOPS.900͑Β͍͠ͷͰ, ͜ͷ͍ͨͬͯཉ͍͠
ͪͳΈʹ, ϓϩτλΠϓͰ࡞ͬͨ ผͷAIϞσϧ͕มͳ༧ଌͯ͠·ͨ͠ ʢࠓճVer.Ͱ͍͟͝·ͤΜʣ
ສ தਖ਼ͱBIG BOSS ଧ ຊྥଧ ଧ #*(#044ࡀ ʢɾࡕਆʣ
ຊ ଧ ສதਖ਼ࡀ ʢͷ༧ଌʣ ຊ ଧ ΊͬͪΌ৽ঙ߶ࢤબखΜʂʂʂ
͖͏AIͰBIG BOSSͷޙܧऀ, ݟ͚ͭ·ͨ͠ʢ͜ͳΈʣ
݁ͼ
͖͏AIͷ՝ͱ࣍ͷςʔϚ • ৽ਓબखͷ༧ଌ͕ʢϞσϧͷ্༷ʣͰ͖ͳ͍ • ݱϞσϧ௨ࢉϕʔεͰͷֶश&༧ଌͰ͋ΔͨΊ, ࣮ແ͍ϧʔΩʔͷ༧ଌ͕ग़དྷͳ͍ • ߴߍɾେֶͷΛͦͷ··͑…ͱ͍͏୯७ͳղܾ͕Ͱ͖ͳ͍ • Ҏ֎ͷઆ໌มΛՃ͍͑ͨ
• ͬͺΓτϥοΩϯάσʔλ͍͍ͨʂ͋ͱମ֨ͱ͔ • ຊϓϩٿͰΔखஈແ͍͕, ϝδϟʔϦʔάBaseball SavantͰ͍͚ΔͷͰҾ͖ଓ͖AIΛҭ͍͖͍ͯͯͨ • ख൛͕͋Μ·Γ͓͠Ζ͘ͳ͔ͬͨͷ͕չ͍͠ • ҰԠ͋ΔͷͰ͕͢, ඍົͩͬͨͷͰൃද߇͑·ͨ͠, ࠤʑ ࿕رͷະདྷ༧ਤݟͯΈ͍ͨͷͰ͏গ͕͠ΜΓ·͢. • ݱ࣮తʹ, ϓϩٿͰΓͳ͍ಛྔ͕͋Γ·ͯ͠…ϝδϟʔϦʔά൛े࣮༻ʹת͑ΔͷͰ͕͢😇
࣍ͷల։ • ͍ʢ༧ଌʣαΠτͷ্ཱͪ͛. σʔλͷݖརͱ͔ॾʑ্ख͘ղ্ܾͨ͠Ͱʢଟ͍͚Δͱࢥ͏ʣ. • ༧ଌΞϧΰϦζϜͷվྑ. ϝδϟʔϦʔά൛ͰτϥοΩϯάσʔλΛͬͨϞσϧͷ։ൃ. •
PyCon JP 2023ͱ͔, ϦΞϧ։࠵ͷBaseball Play StudyͰ·ͨձ͓͏.
ಥવͰ͕͢””͍͍ͬͯͰ͔͢? • ٿAIηΠόʔϝτϦΫεͱػցֶशͷԠ༻Ͱ࣮Մೳ • ٿAIBigQueryPythonͰ࡞ΕΔ • ัखัखΛΔ͖Ͱ, ϚϯνϡBIG BOSSͷޙܧऀ ·ͩ·ͩ༡΅͏ͱࢥ͍·͢ͷͰҾ͖ଓ͖ΑΖ͘͠ʂ
ήʔϜηοτ ͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ Shinichi Nakagawa(Twitter/Facebook/etc… @shinyorke)