Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BigQueryとPythonではじめるプロ野球選手の成績予測(もしくは成績占い) / Bas...
Search
Shinichi Nakagawa
May 27, 2022
Research
0
3.9k
BigQueryとPythonではじめるプロ野球選手の成績予測(もしくは成績占い) / Baseball Player Performance Prediction using BigQuery and Python
Baseball Play Study mini 2022/5/27 登壇資料
Shinichi Nakagawa
May 27, 2022
Tweet
Share
More Decks by Shinichi Nakagawa
See All by Shinichi Nakagawa
実践Dash - 手を抜きながら本気で作るデータApplicationの基本と応用 / Dash for Python and Baseball
shinyorke
2
380
Terraform, GitHub Actions, Cloud Buildでデータ基盤をProvisioningする / Data Platform provisioning for Google Cloud and Terraform
shinyorke
2
2.7k
Cloud RunとCloud PubSubでサーバレスなデータ基盤2024 with Terraform / Cloud Run and PubSub with Terraform
shinyorke
10
2.6k
自らを強いエンジニアにするための3つの習慣 / I need to be myself, I can't be no one else
shinyorke
77
58k
阪神タイガース優勝のひみつ - Pythonでシュッと調べた件 / SABRmetrics for Python
shinyorke
1
1.2k
Pythonとクラウドと野球の推し活. / Baseball Data Platform for Python and Google Cloud
shinyorke
2
2.6k
月額コーヒー3.34杯分のコストでオオタニサンの活躍を見守るデータ基盤のはなし / Pyhack Con
shinyorke
2
430
俺のDXを実現するためのサーバレスなデータ基盤開発と運用 / Serverless Data Platform and Baseball
shinyorke
5
11k
機械学習エンジニアが目指すキャリアパスとその実話 / My Journey to Become a ML Engineer
shinyorke
7
15k
Other Decks in Research
See All in Research
ICLR2024: Reading "Training Unbiased Diffusion Models From Biased Dataset"
hotekagi
0
100
医療分野におけるLLMの現状と応用可能性について
kento1109
11
3.3k
Embers of Autoregression: Understanding Large Language Models Through the Problem They are Trained to Solve
eumesy
PRO
6
1.1k
Language is primarily a tool for communication rather than thought
ryou0634
4
680
3次元点群の分類における評価指標について
kentaitakura
0
190
「人間にAIはどのように辿り着けばよいのか?ー 系統的汎化からの第一歩 ー」@第22回 Language and Robotics研究会
maguro27
0
540
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
280
日本語医療LLM評価ベンチマークの構築と性能分析
fta98
3
480
工学としてのSRE再訪 / Revisiting SRE as Engineering
yuukit
18
10k
第28回 著者ゼミ:Identification of drug responsible glycogene signature in liver carcinoma from meta-analysis using RNA-seq data
ktatsuya
2
250
DiscordにおけるキャラクターIPを活用したUGCコンテンツ生成サービスの ラピッドプロトタイピング ~国際ハッカソンでの事例研究
o_ob
0
230
第60回名古屋CV・PRML勉強会:CVPR2024論文紹介(AM-RADIO)
naok615
0
230
Featured
See All Featured
The Language of Interfaces
destraynor
154
24k
The Pragmatic Product Professional
lauravandoore
31
6.2k
Speed Design
sergeychernyshev
22
480
YesSQL, Process and Tooling at Scale
rocio
167
14k
Embracing the Ebb and Flow
colly
84
4.4k
Mobile First: as difficult as doing things right
swwweet
222
8.8k
[RailsConf 2023] Rails as a piece of cake
palkan
49
4.7k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
126
18k
Code Review Best Practice
trishagee
62
16k
Optimizing for Happiness
mojombo
375
69k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
27
1.9k
It's Worth the Effort
3n
183
27k
Transcript
ಥવͰ͕͢””͍͍ͬͯͰ͔͢? Shinichi Nakagawa@shinyorke Baseball Play Study mini 2022/05/27
ຊͷςʔϚʮٿͱAIͱٕज़ʯ • ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεͱΞϧΰϦζϜ • ٿAIΛࢧ͑Δٕज़ - PythonͱGoogle CloudΛఴ͑ͯ • ٿAIͰ͍·͢,
ʮਪ͠ͷબखͷ5ઌʯ ͖͏ͷਓೳΛ࡞ͬͨͷͰҰॹʹ༡΅͏ͥ⽁ʢཁʣ
ࠓճͷ͍ʮଧऀͷʯͰ͢ खVer.ແ͘ͳ͍Ͱ͕͢, ݁Ռ͕ඍົͩͬͨͷͰଧऀͷΈͰΒ͍͖ͤͯͨͩ·͢🙏
Who am I ?ʢ͓લ୭Αʣ • Shinichi Nakagawaʢத ৳Ұʣ • େͷSNSͰʮshinyorkeʢ͠ΜΑʔ͘ʣʯͱ໊͍ͬͯ·͢
• ΞΫηϯνϡΞגࣜձࣾϚωʔδϟʔʢຊۀʣ • ຊۀͷํͰʮGoogle Cloudڧ͍ϚϯʯతͳཱͪҐஔͰ ιϦϡʔγϣϯΞʔΩςΫτʢSRE/DevOpsपΓʣ • ݸਓ׆ಈʮੜͷٿσʔλαΠΤϯςΟετʯͱͯ͠ ٿʹؔ͢ΔσʔλαΠΤϯεͱΤϯδχΞϦϯάΛ͍ͯ͠·͢ ʢ͔ͭ, ຊۀͰػցֶशΤϯδχΞɾσʔλαΠΤϯςΟετܦݧ͋Γʣ • ւಓຊϋϜϑΝΠλʔζ&ΦʔΫϥϯυɾΞεϨνοΫεͷϑΝϯ⽁
ຊͷଧॱ • ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεೖ • ٿAIΛ࣮͢Δ - Google CloudΛఴ͑ͯ • ಥવͰ͕͢””͍͍ͬͯͰ͔͢⽁
- ٿAIͰ
ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεೖ
ٿAIΛࢧ͑ΔηΠόʔϝτϦΫε • ηΠόʔϝτϦΫε #ͱ • ηΠόʔϝτϦΫεͷ͖΄Μ • ʮͦͬ͘Γ͞Μʯ͔Β༧ଌ - PECOTAϞσϧ
• shinyorke’s༧ଌϞσϧʮzobristʯվΊʮkenshiʯ શ෦͢ͱ3.34͔͔࣌ؒΔͷͰࠓ֓ཁͷΈհ🐯
ηΠόʔϝτϦΫε #ͱ • ٿʹ͓͍ͯൃੜ͢ΔσʔλΛ౷ܭֶతͳΞϓϩʔνͰੳΛߦ͍, ʮબखͷೳྗʯʮνʔϜͷڧ͞ʯͳͲநతͳ֓೦ΛఆྔతʹࢦඪԽ͠, νʔϜɾબखɾϑΝϯʹཱͯΔͨΊͷՊֶతͳΞϓϩʔνɾߟ͑ํͷ͜ͱ. • Ҏલσʔλ͕ओྲྀ͕ͩͬͨ,
ʮελοτΩϟετʯʮτϥοΫϚϯʯͱ͍ͬ ͨ, ܭଌػثτϥοΩϯάσʔλΛ༻͍ͯߦ͏ͷ͕ࠓͷτϨϯυ • ͳ͓, σʔλͷΈͰे͗͢Δ͙Β͍໘ന͍ࣄ͕ग़དྷ·͢ ʢ㲈τϥοΩϯάσʔλٿɾٕज़ڞʹઐ͕ࣝΘΕΔ&қߴ͍ʣ
ηΠόʔϝτϦΫεͷ͖΄Μ • ηΠόʔϝτϦΫεγϯϓϧͳ࢛ଇԋࢉ͓Αͼ౷ܭͰߦ͏ࣄ͕Ͱ͖Δ • Α͘ΒΕ͍ͯΔʮOPSʯʮWHIPSʯͳͲ, ࣜͦͷͷిExcelͰܭࢉ͕Մೳʢ㲈ϓϩάϥϛϯάෆཁʣ • Ұํ, ʮWARʯʮRCʯͳͲͷࢦඪܭࢉׂ͕ͱෳࡶ,
ExcelͰग़དྷͳ͘ແ͍͕, ϓϩάϥϛϯάSQL, ػցֶशͳͲͰॲཧͨ͠΄͏͕ྑ͍ύλʔϯଘࡏ͢Δ. • ༧ଌʮಛྔΤϯδχΞϦϯάʯͱͯ͠ѻ͏ͱ࣮ݱ͢Δ͜ͱ͕Ͱ͖Δʂ ʢͱ͍͏ͷ͕͜ͷൃදͷٕज़తͳςʔϚͰ͢ʣ
ٿσʔλΛಛྔʹม͢Δ ಛྔʢ㲈ʣʹมɾ୯ҐΛἧ͑Δಓͳ࡞ۀ͕ඞཁ • -> • ͦͷ··͑ΔϞϊ͕ଟ͍. ྫ͑҆ଧ, ࢛ٿ,
ࡾৼͳͲ. • Θ͔Γ͍͢୯Ґʹਖ਼نԽɾεέʔϦϯά͢Δ. RC, wRAA, wOBAͳͲͷηΠόʔϝτϦΫεࢦඪ. • Ҏ֎ͷσʔλ -> • ར͖ଧ੮ͷࠨӈ, ఱવࣳ or ਓࣳ, ֎ or υʔϜ or େࣗવʢॴͱݴ͍ͬͯͳ͍ʣ? • Ͱແ͍σʔλΛಛྔʹ͢ΔͨΊͷॲཧ͕ඞཁʢΧςΰϦʔʹ͢ΔͳͲʣ
ϓϩٿબखͷΛ͏ٕज़ • ༧ଌͦͷͷηΠόʔϝτϦΫεᴈ໌ظ͔Β͋Δఆ൪ωλͰ, ΞϝϦΧʹϑΝϯ͚ͷ༧ଌαΠτ͕͋Δ͙Β͍ͷΓ্͕Γ. • τϥοΩϯάσʔλ͕ओྲྀͷࠓͰબखͷ݈߁ཧύϑΥʔϚϯε ଌఆͳͲΛ௨ͯ͡কདྷͷύϑΥʔϚϯεΛ༧ଌ͢Δ͜ͱ. ※༧ଌͷݱ׆༻,
ͱݴ͑ΔʢPlayer’s Developmentʣ • ݹయత͔ͭදతͳ༧ଌϞσϧͱͯ͠, PECOTAʢϖίλʣ͕༗໊.
PECOTA - ࠷౷ܭతͳ༧ଌϞσϧ • 2003ʢ19લʣʹϦϦʔεͨ͠MLBͷ༧ଌϞσϧ • ʮաڈͷࣅ͍ͯΔબखͷʯ͔Β༧ଌΛࢉग़ ͳ͓۩ମతͳख๏ɾࣜඇެ։ʢߟ͑ํͪΒ΄Βॻ͍ͯ͋Δʣ •
ޙʹ2008ถࠃେ౷ྖબڍͷউऀΛ49/50भతதͤͨ͞ ౷ܭֶऀωΠτɾγϧόʔ͕։ൃ ※ؾʹͳΔํʮγάφϧ&ϊΠζʯͱ͍͏ॻ੶ΛಡΜͰ͍ͩ͘͞
ʮͦͬ͘Γ͞ΜʯΛ୳͢ࣄͰΛ༧ଌͰ͖Δ!? աڈϝδϟʔϦʔάͰσϏϡʔͨ͠બख2021·Ͱʹ20, 370ਓ͍ΔʢLahman’s Baseball Databaseௐʣ ͜Ε͚͍ͩΕ, ʮੲͷ͋ͷਓͬΆ͍ʯ͙Β͍ग़ͤΔͷͰͳ͔Ζ͏͔???
shinyorke’s༧ଌϞσϧʮkenshiʯര • աڈʢؚΉݱʣʹଘࡏͨ͠ٿબखͷΛݩʹ, ʮࣅ͍ͯΔબखΛΫϥελϦϯάʯ Ͱ͖ͨΒ༧ଌ࡞ΕΔͷͰ? -> ࣮PECOTA͜ͷΞϓϩʔνʢ࠷ॳظʣ • ηΠόʔϝτϦΫεͰʮྨࣅੑείΞʯͱ͍͏ࣅ͍ͯΔબखΛಋ͕ࣜ͋͘Δ͕,
೦ͳ͕Β͕ܽଟ͍ʢ௨ࢉͰΫϥελϦϯά͢ΔͨΊ, όΠΞε͕ڧ͘ग़Δʣ • ʮ͋ΔಛྔΛݩʹΫϥελϦϯάʯಛྔΤϯδχΞϦϯά͕ಘҙͳλεΫ ػցֶशతͳΞϓϩʔνͰߦ͚ΔͷͰ?આ -> Ͱ͖ͨ🙌 • ϝδϟʔϦʔά൛AIʮzobristʯΛ։ൃ -> ͍͍ײͩͬͨ͡ͷͰຊϓϩٿ൛Λ࡞ˡࠓ͜͜ ͜͏ͯ͠, shinyorke’sϓϩٿ༧ଌϞσϧ&ٿAIʮkenshiʯ͕ര.
ٿAIΛ࣮͢Δ - Google CloudΛఴ͑ͯ
ٿAIʮkenshiʯΛ࣮͢Δ • ΞʔΩςΫνϟͷશମ૾ • σʔλऔಘͱલॲཧ • ΞϧΰϦζϜΛܾΊͯΫϥελϦϯά • ༧ଌΛ፻͢Δੜ͢Δ ͪͳΈʹkenshi໊ͬͯલͷ༝དྷӈ྆ଧͷ͋ͷબखΑΓʢࠢʣ
ϓϩٿબख༧ଌϓϩμΫτશମ૾
ΞʔΩͷجຊํ • σʔλͯ͢BigQueryʹूΊΔʢ㲈Google CloudͰͯ͢ΛݻΊͨཧ༝ʣ • ֶशσʔλςετσʔλͯ͢BQ • ޙड़͢ΔલॲཧɾσʔλཧΛͳΔ͘SQLͰΓ͔ͨͬͨ • αʔόϨεͳαʔϏεΛத৺ʹબΜͰ͏ʢ㲈VMͰ͋Δඞཁ͕ແ͍ʣ
• ΞϓϦΫϩʔϥʔCI/CDαʔόϨεܥͷαʔϏεͰݻΊΔ • ʮͬͨʯ͚ͩඅ༻ʹͳΔͷͰࡒʹ༏͍͠&εέʔϦϯάָ
αϥοͱղઆ • Data Analytics • BigQuery͕ͯ͢ͷத৺, σʔλͯ͢͜͜ • Cloud ConsoleͰΫΤϦʔΛॻ͍ͯσʔληοτ࡞,
͍͠λεΫJupyter Lab্Ͱ࣮ࢪ • ωοτ͔Βऩू͢ΔσʔλʢCSVʣCloud Storageʹอଘ, Cloud FunctionsΛͬͯBigQueryʹExport • Web App • StreamlitʢޙͰղઆʣͰ࣮ͨ͠ΞϓϦΛCloud RunͰϗετ • CI/CDGitHub ActionsͰαΫοͱ
ϗϯτʹࡉ͔͍ٕज़ղઆϒϩάͰ https://shinyorke.hatenablog.com/entry/cloud-arch-serverless ࠓճͷൃද༻ͷ͓ֆ͔͖Ͱ͕ͨ͠ϒϩάͰόζͬͨ&ผͰৄͤ͘͠Εʂ
σʔλͷऔಘ • ֶशσʔλϝδϟʔϦʔάͷσʔλΛ༻ • Lahman’s Baseball Database • ্هσʔλϕʔεͷCSVσʔλΛBigQueryʹimport •
ϓϩٿͷσʔλBaseball Reference͔ΒεΫϨΠϐϯά • 2021γʔζϯऴྃ࣌ΛݩʹεΫϨΠϐϯά • Pythonͷrequests-htmlͰΫϩʔϥʔΛ࣮, CSVอଘ -> BigQuery
ϝδϟʔϦʔάͷσʔλΛͬͨཧ༝ • ຊͷϓϩٿͰ·ͱ·ͬͨσʔληοτ͕ଘࡏ͠ͳ͍ • ͋Δॴʹ͋Δ͕, ݖརతʹ͑Δ͔ո͍͠ • ϝδϟʔϦʔάΦʔϓϯσʔλ͕ॆ࣮͔ͭݖརେৎ • αϯϓϧσʔλͷେ͖͞ʢ100Ҏ্͋ΔͷͰे͗͢Δʣ
• ಉ͡ٿͱ͍͏ڝٕ͔ͭهมΘΒͳ͍ͷͰӨڹগͳ͍ͱஅ
લॲཧ • ֶशʹඞཁͳσʔλSQLͰՃ, Viewʹͯ͠อଘ →Google Cloud ConsoleͰ࣮ࢪ • Ͳ͏ͯ͠SQLͰ໘͍͘͞ͷΛPandasͳͲͰॲཧ
→ࣗͷPC্ʹ࡞ͬͨJupyter LabڥͰ࣮ࢪ • ֶशʹඞཁͳ௨ࢉɾผΛࢉग़͢ΔͨΊͷ ΫΤϦʔσʔληοτΛͻͨ͢Β࡞Γ·ͬͨ͘
લॲཧͷྫ - SQLͰߦ͏ٿͷಛྔநग़ • ଧ, ग़ྥ, OPSతͳͷ SQLͰܭࢉͰ͖Δ. •
͏ͪΐͬͱෳࡶͳࢦඪ. ྫ͑wOBAͱ͔. • ্هBigQueryͰ݁͠·ͨ͠.
લॲཧͷྫ - SQLͰߦ͑ͳ͍ͷ? • ࡶͳॲཧɾܭࢉ͕ೖͬͨΓ, ߦྻͰ·ͱ·ͬͨϞϊͷॲཧ PythonRͰॲཧ͕ϕετ. •
ྫ͑ϐϘοτςʔϒϧ, άϧʔϐϯάͳͲPandasͰ ॻ͍ͨ΄͏͕Θ͔Γ͍͢ ͱ͖͋Δʢॾઆ͋Γ·͢ʣ • SQL͕ۤखͳํશ෦ͬͪ͜Ͱͬͯྑ͍͔.
ΞϧΰϦζϜΛܾΊͯΫϥελϦϯά • ʮࣅ͍ͯΔબखʯΛྨ͢ΔλεΫ • ΞϧΰϦζϜΛܾΊΔˠ࠷ऴతʹANNʹ • AnnoyʢΞϊΠʔʣͰരANN ྨλεΫΛ࡞Γ, ςετΛॻ͖, γϡοͱCIͰ࠶࣮ߦՄೳʹ.
ࣅ͍ͯΔબखΛ୳͢ɾྨ͢Δ • ௨ࢉͱकඋҐஔ͝ͱͷग़ճΛಛྔͱ͢Δ͜ͱʹΑΓ, ʮࣅ͍ͯΔબखʯΛ୳͢͜ͱ͕ՄೳͳͷͰ? • ಛྔΛͬͯΫϥελϦϯάͯ͠ڑΛܭଌ, ͍ۙॱͰϥϯΩϯάԽ͢ΔʢϢʔΫϦουڑͳͲͰʣ •
ͳ͓, PECOTAʢ͓ͦΒ͘ʣߟ͑ํಉ͡.
ANNʢۙࣅ࠷ۙ୳ࡧʣΛ࠾༻ • ग़ࢼ߹, ଧ੮, ओཁͳଧܸʢ҆ଧ, ຊྥଧ, ଧ, etc…ʣ • कඋҐஔʢશ9ϙδγϣϯ,
DHߟྀ͠ͳ͍ʣผͷग़ճ • ্هΛಛྔͱͯ͠ANNʢۙࣅ࠷ۙ୳ࡧʣΛ͔ͭͬͯ ϢʔΫϦουڑΛࢉग़͠, ͍ۙબखΛूΊΔ͜ͱʹ. • ʮAIʹΑΔࣆδϟύϯબग़ʯͱ͍͏ωλͰར༻->݁Ռ্ʑ https://shinyorke.hatenablog.com/entry/tokyo2020-samurai-japan • ࣮Annoyͱ͍͏ศརͳϥΠϒϥϦΛ͍·ͨ͠.
AnnoyΛͬͨANNʹΑΔΫϥελϦϯά. ूΊͨσʔλΛ͠ࠐΜͰΔ͜ͱͰΫϥελϦϯά͕Ͱ͖·ͨ͠.
݁ՌΛݟͯΈͨ • ΦϦοΫε٢ాਖ਼ঘʹࣅ͍ͯΔਓΛ୳͢ • ༧ଌϞσϧʹ٢ాਖ਼ঘͷΛͯ͠ ΫϥελϦϯά݁ՌΛௐࠪ • ϋϯΫɾΞʔϩϯ, ΟϦʔɾϝΠζ,
ήϨʔϩଞ, ࣅ͍ͯΔ֎ख͕औΕͨͷͰ ޭͱݴ͑ͦ͏🎉 ※ήϨʔϩڈΦΦλχαϯͱHRԦ૪͍ͨ͠ήϨʔϩJr.ͷ͓͞Μ
༧ଌͷग़͠ํ • ΫϥελϦϯάͷ݁Ռ, ্ҐʹϥϯΩϯά͞Εͨબखͷ ྸผΛऔಘ • ྸผͷฏۉύʔηϯλΠϧΛࢼͯ͠, ऩ·Γͷྑ͍ࣈʹ͢Δ
• ଧɾ҆ଧͳͲʮੵΈॏͶʯͷΛ༧ଌޙ, ଧͳͲͷʮʯΛද͢Λܭࢉ
ϓϩμΫτʹ͢Δ • ͻͱ·࣮ͣݧతͳΞϓϦέʔγϣϯΛ StreamlitͰ࣮ • StreamlitҰݴͰݴ͏ͱ ʮJupyter notebookΛΞϓϦʹ͢Δʯ
ͨΊͷFramework • Dockerίϯςφʹͯ͠ Cloud RunͰϗεςΟϯά
ಥવͰ͕͢””͍͍ͬͯͰ͔͢?
AIͰ͏ʮࠓ, ؾʹͳΔϓϩٿબखʯ • ݱࡏઈௐ, ޥͷ͋ͷਓ • ೋ಄ཽʢೋྲྀʣͤ͞Δඞཁ͋Δͷ͔ແ͍ͷ͔? • BIG BOSSʹࣅͯΔʢ͔͠Εͳ͍ʣ͋ͷબख
ຊ12ٿஂ৮Ε͍ͨ…Ͱ͕࣌ؒ͢ͷ߹ʹΑΓ🙏
ઈௐͳޥͷ͋ͷਓͱ͍͑ • ࡔ কޗʢౡʣ - 2016υϥϑτ4Ґ • ࡢ͍ͭʹϒϨΠΫ, ࠓ͜͜·Ͱଧരൃ •
ϝΠϯัख͕ͩकΕΔϢʔςΟϦςΟ
͜ΕΤά͍ະདྷ༧ਤʢੌʣ
ࡔ কޗબखͷະདྷ • ࠓͷ༧ʮଧ.309 ຊྥଧ20ຊ ଧ70 OPS .903ʯ • ڈͷงғؾ͔Β͢ΔͱϦΞϧʹୡՄೳͳ༧ײ͕!?
• ݸਓతʹͬͺัखͬͯ΄͍͠, νʔϜࣄͳΜ͚ͩΕͲ ʢଧͯΔัख͍Δ͚ͩͰΞυόϯςʔδେ͖͍ʣ
ཽͷະདྷΛ͏ - ೋਓͷཽઓ࢜ • AɾϚϧςΟωεʢதʣ - 2018ೖஂ • ࠜඌ ߉ʢதʣ
- 2018υϥϑτ1Ґ • ଧ͓ΑͼೋྲྀͰͪΐͬͱΛݺΜͰ͍ΔೋਓΛ͏
ཽͷະདྷ໌Δ͍͔?
AɾϚϧςΟωεબखͷະདྷ • ࠓͷ༧ʮଧ.290 ຊྥଧ10ຊ ଧ44 OPS .862ʯ • OPSҎ֎ຊؾͰୟ͖ग़ͦ͠͏ͳࣈͳؾ͕͢Δ? •
ཉΛݴ͑֎͡Όͳͯ͘ัखͰग़ͯ΄͍͠ ัखͰ͜Ε͚ͩଧͬͨΒࠓͷٿͩͱੌ͍͜ͱʹ
ͳΔ΄Ͳ?
ࠜඌ ߉બखͷະདྷ • ࠓͷ༧ʮଧ.244 ຊྥଧ1ຊ ଧ6 OPS .654ʯ 5ޙ·Ͱͷ༧ଌ…͏ʔʔΜ?
• ඇৗʹौ͍ධՁ, ೋྲྀΛࢼ͢ҙຯ༧ଌ͚ͩͩͱ͋Γͦ͏? • ൩ܕͱ৴͍ͨ͡, ͍͘ΒͳΜͰٿAIͷධՁ͕ौ͗͢? ͪͳΈʹ౻ݪ ګେʢϩοςʣͳ͔ͳ͔ौ͍ධՁʹ
BIG BOSSͷޙܧऀ୭ͩ? • ສ தਖ਼ʢຊϋϜʣ - 2018υϥϑτ4Ґ • ύϫʔͱεϐʔυ, ࡶ͞Λ݉Ͷἧ͑ͨϑΟδΧϧϞϯελʔ
ϑϧεΠϯάͰ͔ͬඈ͢ଧܸͱڧݞΛੜ͔ͨ͠कඋ ݱ࣌ͷBIG BOSSͦͷͷ • ࢲ, shinyorke͕ࠓ࠷ਪ͍ͯ͠Δϓϩٿબख
ࢥͬͨΑΓBIG BOSSͬΆ͞?
ສ தਖ਼બखͷະདྷ • ࠓͷ༧ʮଧ.252 ຊྥଧ18ຊ ଧ52 OPS .780ʯ • ϗϯτʹୟ͖ग़ͦ͠͏ͳࣈ,
ग़ػձ&ଧ࣍ୈͰ ͳΜͩͬͨΒຊྥଧ༧ଌ௨Γ͔ͨ͠͠Β͔͢? • 5ޙʹOPS.900͑Β͍͠ͷͰ, ͜ͷ͍ͨͬͯཉ͍͠
ͪͳΈʹ, ϓϩτλΠϓͰ࡞ͬͨ ผͷAIϞσϧ͕มͳ༧ଌͯ͠·ͨ͠ ʢࠓճVer.Ͱ͍͟͝·ͤΜʣ
ສ தਖ਼ͱBIG BOSS ଧ ຊྥଧ ଧ #*(#044ࡀ ʢɾࡕਆʣ
ຊ ଧ ສதਖ਼ࡀ ʢͷ༧ଌʣ ຊ ଧ ΊͬͪΌ৽ঙ߶ࢤબखΜʂʂʂ
͖͏AIͰBIG BOSSͷޙܧऀ, ݟ͚ͭ·ͨ͠ʢ͜ͳΈʣ
݁ͼ
͖͏AIͷ՝ͱ࣍ͷςʔϚ • ৽ਓબखͷ༧ଌ͕ʢϞσϧͷ্༷ʣͰ͖ͳ͍ • ݱϞσϧ௨ࢉϕʔεͰͷֶश&༧ଌͰ͋ΔͨΊ, ࣮ແ͍ϧʔΩʔͷ༧ଌ͕ग़དྷͳ͍ • ߴߍɾେֶͷΛͦͷ··͑…ͱ͍͏୯७ͳղܾ͕Ͱ͖ͳ͍ • Ҏ֎ͷઆ໌มΛՃ͍͑ͨ
• ͬͺΓτϥοΩϯάσʔλ͍͍ͨʂ͋ͱମ֨ͱ͔ • ຊϓϩٿͰΔखஈແ͍͕, ϝδϟʔϦʔάBaseball SavantͰ͍͚ΔͷͰҾ͖ଓ͖AIΛҭ͍͖͍ͯͯͨ • ख൛͕͋Μ·Γ͓͠Ζ͘ͳ͔ͬͨͷ͕չ͍͠ • ҰԠ͋ΔͷͰ͕͢, ඍົͩͬͨͷͰൃද߇͑·ͨ͠, ࠤʑ ࿕رͷະདྷ༧ਤݟͯΈ͍ͨͷͰ͏গ͕͠ΜΓ·͢. • ݱ࣮తʹ, ϓϩٿͰΓͳ͍ಛྔ͕͋Γ·ͯ͠…ϝδϟʔϦʔά൛े࣮༻ʹת͑ΔͷͰ͕͢😇
࣍ͷల։ • ͍ʢ༧ଌʣαΠτͷ্ཱͪ͛. σʔλͷݖརͱ͔ॾʑ্ख͘ղ্ܾͨ͠Ͱʢଟ͍͚Δͱࢥ͏ʣ. • ༧ଌΞϧΰϦζϜͷվྑ. ϝδϟʔϦʔά൛ͰτϥοΩϯάσʔλΛͬͨϞσϧͷ։ൃ. •
PyCon JP 2023ͱ͔, ϦΞϧ։࠵ͷBaseball Play StudyͰ·ͨձ͓͏.
ಥવͰ͕͢””͍͍ͬͯͰ͔͢? • ٿAIηΠόʔϝτϦΫεͱػցֶशͷԠ༻Ͱ࣮Մೳ • ٿAIBigQueryPythonͰ࡞ΕΔ • ัखัखΛΔ͖Ͱ, ϚϯνϡBIG BOSSͷޙܧऀ ·ͩ·ͩ༡΅͏ͱࢥ͍·͢ͷͰҾ͖ଓ͖ΑΖ͘͠ʂ
ήʔϜηοτ ͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ Shinichi Nakagawa(Twitter/Facebook/etc… @shinyorke)