Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BigQueryとPythonではじめるプロ野球選手の成績予測(もしくは成績占い) / Bas...
Search
Shinichi Nakagawa
May 27, 2022
Research
0
3.9k
BigQueryとPythonではじめるプロ野球選手の成績予測(もしくは成績占い) / Baseball Player Performance Prediction using BigQuery and Python
Baseball Play Study mini 2022/5/27 登壇資料
Shinichi Nakagawa
May 27, 2022
Tweet
Share
More Decks by Shinichi Nakagawa
See All by Shinichi Nakagawa
実践Dash - 手を抜きながら本気で作るデータApplicationの基本と応用 / Dash for Python and Baseball
shinyorke
2
1.1k
Terraform, GitHub Actions, Cloud Buildでデータ基盤をProvisioningする / Data Platform provisioning for Google Cloud and Terraform
shinyorke
2
2.8k
Cloud RunとCloud PubSubでサーバレスなデータ基盤2024 with Terraform / Cloud Run and PubSub with Terraform
shinyorke
10
2.8k
自らを強いエンジニアにするための3つの習慣 / I need to be myself, I can't be no one else
shinyorke
77
58k
阪神タイガース優勝のひみつ - Pythonでシュッと調べた件 / SABRmetrics for Python
shinyorke
1
1.3k
Pythonとクラウドと野球の推し活. / Baseball Data Platform for Python and Google Cloud
shinyorke
2
2.7k
月額コーヒー3.34杯分のコストでオオタニサンの活躍を見守るデータ基盤のはなし / Pyhack Con
shinyorke
2
460
俺のDXを実現するためのサーバレスなデータ基盤開発と運用 / Serverless Data Platform and Baseball
shinyorke
5
11k
機械学習エンジニアが目指すキャリアパスとその実話 / My Journey to Become a ML Engineer
shinyorke
9
16k
Other Decks in Research
See All in Research
Language is primarily a tool for communication rather than thought
ryou0634
4
730
文献紹介:A Multidimensional Framework for Evaluating Lexical Semantic Change with Social Science Applications
a1da4
1
220
20240820: Minimum Bayes Risk Decoding for High-Quality Text Generation Beyond High-Probability Text
de9uch1
0
120
marukotenant01/tenant-20240826
marketing2024
0
510
テキストマイニングことはじめー基本的な考え方からメディアディスコース研究への応用まで
langstat
1
120
外積やロドリゲスの回転公式を利用した点群の回転
kentaitakura
1
640
機械学習による言語パフォーマンスの評価
langstat
6
710
Physics of Language Models: Part 3.1, Knowledge Storage and Extraction
sosk
1
940
[ECCV2024読み会] 衛星画像からの地上画像生成
elith
0
420
snlp2024_multiheadMoE
takase
0
420
論文紹介/Expectations over Unspoken Alternatives Predict Pragmatic Inferences
chemical_tree
1
260
メールからの名刺情報抽出におけるLLM活用 / Use of LLM in extracting business card information from e-mails
sansan_randd
2
130
Featured
See All Featured
Statistics for Hackers
jakevdp
796
220k
Optimising Largest Contentful Paint
csswizardry
33
2.9k
Measuring & Analyzing Core Web Vitals
bluesmoon
3
78
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
The Cult of Friendly URLs
andyhume
78
6k
A Philosophy of Restraint
colly
203
16k
Thoughts on Productivity
jonyablonski
67
4.3k
Navigating Team Friction
lara
183
14k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Designing the Hi-DPI Web
ddemaree
280
34k
Art, The Web, and Tiny UX
lynnandtonic
297
20k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
126
18k
Transcript
ಥવͰ͕͢””͍͍ͬͯͰ͔͢? Shinichi Nakagawa@shinyorke Baseball Play Study mini 2022/05/27
ຊͷςʔϚʮٿͱAIͱٕज़ʯ • ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεͱΞϧΰϦζϜ • ٿAIΛࢧ͑Δٕज़ - PythonͱGoogle CloudΛఴ͑ͯ • ٿAIͰ͍·͢,
ʮਪ͠ͷબखͷ5ઌʯ ͖͏ͷਓೳΛ࡞ͬͨͷͰҰॹʹ༡΅͏ͥ⽁ʢཁʣ
ࠓճͷ͍ʮଧऀͷʯͰ͢ खVer.ແ͘ͳ͍Ͱ͕͢, ݁Ռ͕ඍົͩͬͨͷͰଧऀͷΈͰΒ͍͖ͤͯͨͩ·͢🙏
Who am I ?ʢ͓લ୭Αʣ • Shinichi Nakagawaʢத ৳Ұʣ • େͷSNSͰʮshinyorkeʢ͠ΜΑʔ͘ʣʯͱ໊͍ͬͯ·͢
• ΞΫηϯνϡΞגࣜձࣾϚωʔδϟʔʢຊۀʣ • ຊۀͷํͰʮGoogle Cloudڧ͍ϚϯʯతͳཱͪҐஔͰ ιϦϡʔγϣϯΞʔΩςΫτʢSRE/DevOpsपΓʣ • ݸਓ׆ಈʮੜͷٿσʔλαΠΤϯςΟετʯͱͯ͠ ٿʹؔ͢ΔσʔλαΠΤϯεͱΤϯδχΞϦϯάΛ͍ͯ͠·͢ ʢ͔ͭ, ຊۀͰػցֶशΤϯδχΞɾσʔλαΠΤϯςΟετܦݧ͋Γʣ • ւಓຊϋϜϑΝΠλʔζ&ΦʔΫϥϯυɾΞεϨνοΫεͷϑΝϯ⽁
ຊͷଧॱ • ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεೖ • ٿAIΛ࣮͢Δ - Google CloudΛఴ͑ͯ • ಥવͰ͕͢””͍͍ͬͯͰ͔͢⽁
- ٿAIͰ
ٿAIΛ࡞ΔͨΊͷηΠόʔϝτϦΫεೖ
ٿAIΛࢧ͑ΔηΠόʔϝτϦΫε • ηΠόʔϝτϦΫε #ͱ • ηΠόʔϝτϦΫεͷ͖΄Μ • ʮͦͬ͘Γ͞Μʯ͔Β༧ଌ - PECOTAϞσϧ
• shinyorke’s༧ଌϞσϧʮzobristʯվΊʮkenshiʯ શ෦͢ͱ3.34͔͔࣌ؒΔͷͰࠓ֓ཁͷΈհ🐯
ηΠόʔϝτϦΫε #ͱ • ٿʹ͓͍ͯൃੜ͢ΔσʔλΛ౷ܭֶతͳΞϓϩʔνͰੳΛߦ͍, ʮબखͷೳྗʯʮνʔϜͷڧ͞ʯͳͲநతͳ֓೦ΛఆྔతʹࢦඪԽ͠, νʔϜɾબखɾϑΝϯʹཱͯΔͨΊͷՊֶతͳΞϓϩʔνɾߟ͑ํͷ͜ͱ. • Ҏલσʔλ͕ओྲྀ͕ͩͬͨ,
ʮελοτΩϟετʯʮτϥοΫϚϯʯͱ͍ͬ ͨ, ܭଌػثτϥοΩϯάσʔλΛ༻͍ͯߦ͏ͷ͕ࠓͷτϨϯυ • ͳ͓, σʔλͷΈͰे͗͢Δ͙Β͍໘ന͍ࣄ͕ग़དྷ·͢ ʢ㲈τϥοΩϯάσʔλٿɾٕज़ڞʹઐ͕ࣝΘΕΔ&қߴ͍ʣ
ηΠόʔϝτϦΫεͷ͖΄Μ • ηΠόʔϝτϦΫεγϯϓϧͳ࢛ଇԋࢉ͓Αͼ౷ܭͰߦ͏ࣄ͕Ͱ͖Δ • Α͘ΒΕ͍ͯΔʮOPSʯʮWHIPSʯͳͲ, ࣜͦͷͷిExcelͰܭࢉ͕Մೳʢ㲈ϓϩάϥϛϯάෆཁʣ • Ұํ, ʮWARʯʮRCʯͳͲͷࢦඪܭࢉׂ͕ͱෳࡶ,
ExcelͰग़དྷͳ͘ແ͍͕, ϓϩάϥϛϯάSQL, ػցֶशͳͲͰॲཧͨ͠΄͏͕ྑ͍ύλʔϯଘࡏ͢Δ. • ༧ଌʮಛྔΤϯδχΞϦϯάʯͱͯ͠ѻ͏ͱ࣮ݱ͢Δ͜ͱ͕Ͱ͖Δʂ ʢͱ͍͏ͷ͕͜ͷൃදͷٕज़తͳςʔϚͰ͢ʣ
ٿσʔλΛಛྔʹม͢Δ ಛྔʢ㲈ʣʹมɾ୯ҐΛἧ͑Δಓͳ࡞ۀ͕ඞཁ • -> • ͦͷ··͑ΔϞϊ͕ଟ͍. ྫ͑҆ଧ, ࢛ٿ,
ࡾৼͳͲ. • Θ͔Γ͍͢୯Ґʹਖ਼نԽɾεέʔϦϯά͢Δ. RC, wRAA, wOBAͳͲͷηΠόʔϝτϦΫεࢦඪ. • Ҏ֎ͷσʔλ -> • ར͖ଧ੮ͷࠨӈ, ఱવࣳ or ਓࣳ, ֎ or υʔϜ or େࣗવʢॴͱݴ͍ͬͯͳ͍ʣ? • Ͱແ͍σʔλΛಛྔʹ͢ΔͨΊͷॲཧ͕ඞཁʢΧςΰϦʔʹ͢ΔͳͲʣ
ϓϩٿબखͷΛ͏ٕज़ • ༧ଌͦͷͷηΠόʔϝτϦΫεᴈ໌ظ͔Β͋Δఆ൪ωλͰ, ΞϝϦΧʹϑΝϯ͚ͷ༧ଌαΠτ͕͋Δ͙Β͍ͷΓ্͕Γ. • τϥοΩϯάσʔλ͕ओྲྀͷࠓͰબखͷ݈߁ཧύϑΥʔϚϯε ଌఆͳͲΛ௨ͯ͡কདྷͷύϑΥʔϚϯεΛ༧ଌ͢Δ͜ͱ. ※༧ଌͷݱ׆༻,
ͱݴ͑ΔʢPlayer’s Developmentʣ • ݹయత͔ͭදతͳ༧ଌϞσϧͱͯ͠, PECOTAʢϖίλʣ͕༗໊.
PECOTA - ࠷౷ܭతͳ༧ଌϞσϧ • 2003ʢ19લʣʹϦϦʔεͨ͠MLBͷ༧ଌϞσϧ • ʮաڈͷࣅ͍ͯΔબखͷʯ͔Β༧ଌΛࢉग़ ͳ͓۩ମతͳख๏ɾࣜඇެ։ʢߟ͑ํͪΒ΄Βॻ͍ͯ͋Δʣ •
ޙʹ2008ถࠃେ౷ྖબڍͷউऀΛ49/50भతதͤͨ͞ ౷ܭֶऀωΠτɾγϧόʔ͕։ൃ ※ؾʹͳΔํʮγάφϧ&ϊΠζʯͱ͍͏ॻ੶ΛಡΜͰ͍ͩ͘͞
ʮͦͬ͘Γ͞ΜʯΛ୳͢ࣄͰΛ༧ଌͰ͖Δ!? աڈϝδϟʔϦʔάͰσϏϡʔͨ͠બख2021·Ͱʹ20, 370ਓ͍ΔʢLahman’s Baseball Databaseௐʣ ͜Ε͚͍ͩΕ, ʮੲͷ͋ͷਓͬΆ͍ʯ͙Β͍ग़ͤΔͷͰͳ͔Ζ͏͔???
shinyorke’s༧ଌϞσϧʮkenshiʯര • աڈʢؚΉݱʣʹଘࡏͨ͠ٿબखͷΛݩʹ, ʮࣅ͍ͯΔબखΛΫϥελϦϯάʯ Ͱ͖ͨΒ༧ଌ࡞ΕΔͷͰ? -> ࣮PECOTA͜ͷΞϓϩʔνʢ࠷ॳظʣ • ηΠόʔϝτϦΫεͰʮྨࣅੑείΞʯͱ͍͏ࣅ͍ͯΔબखΛಋ͕ࣜ͋͘Δ͕,
೦ͳ͕Β͕ܽଟ͍ʢ௨ࢉͰΫϥελϦϯά͢ΔͨΊ, όΠΞε͕ڧ͘ग़Δʣ • ʮ͋ΔಛྔΛݩʹΫϥελϦϯάʯಛྔΤϯδχΞϦϯά͕ಘҙͳλεΫ ػցֶशతͳΞϓϩʔνͰߦ͚ΔͷͰ?આ -> Ͱ͖ͨ🙌 • ϝδϟʔϦʔά൛AIʮzobristʯΛ։ൃ -> ͍͍ײͩͬͨ͡ͷͰຊϓϩٿ൛Λ࡞ˡࠓ͜͜ ͜͏ͯ͠, shinyorke’sϓϩٿ༧ଌϞσϧ&ٿAIʮkenshiʯ͕ര.
ٿAIΛ࣮͢Δ - Google CloudΛఴ͑ͯ
ٿAIʮkenshiʯΛ࣮͢Δ • ΞʔΩςΫνϟͷશମ૾ • σʔλऔಘͱલॲཧ • ΞϧΰϦζϜΛܾΊͯΫϥελϦϯά • ༧ଌΛ፻͢Δੜ͢Δ ͪͳΈʹkenshi໊ͬͯલͷ༝དྷӈ྆ଧͷ͋ͷબखΑΓʢࠢʣ
ϓϩٿબख༧ଌϓϩμΫτશମ૾
ΞʔΩͷجຊํ • σʔλͯ͢BigQueryʹूΊΔʢ㲈Google CloudͰͯ͢ΛݻΊͨཧ༝ʣ • ֶशσʔλςετσʔλͯ͢BQ • ޙड़͢ΔલॲཧɾσʔλཧΛͳΔ͘SQLͰΓ͔ͨͬͨ • αʔόϨεͳαʔϏεΛத৺ʹબΜͰ͏ʢ㲈VMͰ͋Δඞཁ͕ແ͍ʣ
• ΞϓϦΫϩʔϥʔCI/CDαʔόϨεܥͷαʔϏεͰݻΊΔ • ʮͬͨʯ͚ͩඅ༻ʹͳΔͷͰࡒʹ༏͍͠&εέʔϦϯάָ
αϥοͱղઆ • Data Analytics • BigQuery͕ͯ͢ͷத৺, σʔλͯ͢͜͜ • Cloud ConsoleͰΫΤϦʔΛॻ͍ͯσʔληοτ࡞,
͍͠λεΫJupyter Lab্Ͱ࣮ࢪ • ωοτ͔Βऩू͢ΔσʔλʢCSVʣCloud Storageʹอଘ, Cloud FunctionsΛͬͯBigQueryʹExport • Web App • StreamlitʢޙͰղઆʣͰ࣮ͨ͠ΞϓϦΛCloud RunͰϗετ • CI/CDGitHub ActionsͰαΫοͱ
ϗϯτʹࡉ͔͍ٕज़ղઆϒϩάͰ https://shinyorke.hatenablog.com/entry/cloud-arch-serverless ࠓճͷൃද༻ͷ͓ֆ͔͖Ͱ͕ͨ͠ϒϩάͰόζͬͨ&ผͰৄͤ͘͠Εʂ
σʔλͷऔಘ • ֶशσʔλϝδϟʔϦʔάͷσʔλΛ༻ • Lahman’s Baseball Database • ্هσʔλϕʔεͷCSVσʔλΛBigQueryʹimport •
ϓϩٿͷσʔλBaseball Reference͔ΒεΫϨΠϐϯά • 2021γʔζϯऴྃ࣌ΛݩʹεΫϨΠϐϯά • Pythonͷrequests-htmlͰΫϩʔϥʔΛ࣮, CSVอଘ -> BigQuery
ϝδϟʔϦʔάͷσʔλΛͬͨཧ༝ • ຊͷϓϩٿͰ·ͱ·ͬͨσʔληοτ͕ଘࡏ͠ͳ͍ • ͋Δॴʹ͋Δ͕, ݖརతʹ͑Δ͔ո͍͠ • ϝδϟʔϦʔάΦʔϓϯσʔλ͕ॆ࣮͔ͭݖརେৎ • αϯϓϧσʔλͷେ͖͞ʢ100Ҏ্͋ΔͷͰे͗͢Δʣ
• ಉ͡ٿͱ͍͏ڝٕ͔ͭهมΘΒͳ͍ͷͰӨڹগͳ͍ͱஅ
લॲཧ • ֶशʹඞཁͳσʔλSQLͰՃ, Viewʹͯ͠อଘ →Google Cloud ConsoleͰ࣮ࢪ • Ͳ͏ͯ͠SQLͰ໘͍͘͞ͷΛPandasͳͲͰॲཧ
→ࣗͷPC্ʹ࡞ͬͨJupyter LabڥͰ࣮ࢪ • ֶशʹඞཁͳ௨ࢉɾผΛࢉग़͢ΔͨΊͷ ΫΤϦʔσʔληοτΛͻͨ͢Β࡞Γ·ͬͨ͘
લॲཧͷྫ - SQLͰߦ͏ٿͷಛྔநग़ • ଧ, ग़ྥ, OPSతͳͷ SQLͰܭࢉͰ͖Δ. •
͏ͪΐͬͱෳࡶͳࢦඪ. ྫ͑wOBAͱ͔. • ্هBigQueryͰ݁͠·ͨ͠.
લॲཧͷྫ - SQLͰߦ͑ͳ͍ͷ? • ࡶͳॲཧɾܭࢉ͕ೖͬͨΓ, ߦྻͰ·ͱ·ͬͨϞϊͷॲཧ PythonRͰॲཧ͕ϕετ. •
ྫ͑ϐϘοτςʔϒϧ, άϧʔϐϯάͳͲPandasͰ ॻ͍ͨ΄͏͕Θ͔Γ͍͢ ͱ͖͋Δʢॾઆ͋Γ·͢ʣ • SQL͕ۤखͳํશ෦ͬͪ͜Ͱͬͯྑ͍͔.
ΞϧΰϦζϜΛܾΊͯΫϥελϦϯά • ʮࣅ͍ͯΔબखʯΛྨ͢ΔλεΫ • ΞϧΰϦζϜΛܾΊΔˠ࠷ऴతʹANNʹ • AnnoyʢΞϊΠʔʣͰരANN ྨλεΫΛ࡞Γ, ςετΛॻ͖, γϡοͱCIͰ࠶࣮ߦՄೳʹ.
ࣅ͍ͯΔબखΛ୳͢ɾྨ͢Δ • ௨ࢉͱकඋҐஔ͝ͱͷग़ճΛಛྔͱ͢Δ͜ͱʹΑΓ, ʮࣅ͍ͯΔબखʯΛ୳͢͜ͱ͕ՄೳͳͷͰ? • ಛྔΛͬͯΫϥελϦϯάͯ͠ڑΛܭଌ, ͍ۙॱͰϥϯΩϯάԽ͢ΔʢϢʔΫϦουڑͳͲͰʣ •
ͳ͓, PECOTAʢ͓ͦΒ͘ʣߟ͑ํಉ͡.
ANNʢۙࣅ࠷ۙ୳ࡧʣΛ࠾༻ • ग़ࢼ߹, ଧ੮, ओཁͳଧܸʢ҆ଧ, ຊྥଧ, ଧ, etc…ʣ • कඋҐஔʢશ9ϙδγϣϯ,
DHߟྀ͠ͳ͍ʣผͷग़ճ • ্هΛಛྔͱͯ͠ANNʢۙࣅ࠷ۙ୳ࡧʣΛ͔ͭͬͯ ϢʔΫϦουڑΛࢉग़͠, ͍ۙબखΛूΊΔ͜ͱʹ. • ʮAIʹΑΔࣆδϟύϯબग़ʯͱ͍͏ωλͰར༻->݁Ռ্ʑ https://shinyorke.hatenablog.com/entry/tokyo2020-samurai-japan • ࣮Annoyͱ͍͏ศརͳϥΠϒϥϦΛ͍·ͨ͠.
AnnoyΛͬͨANNʹΑΔΫϥελϦϯά. ूΊͨσʔλΛ͠ࠐΜͰΔ͜ͱͰΫϥελϦϯά͕Ͱ͖·ͨ͠.
݁ՌΛݟͯΈͨ • ΦϦοΫε٢ాਖ਼ঘʹࣅ͍ͯΔਓΛ୳͢ • ༧ଌϞσϧʹ٢ాਖ਼ঘͷΛͯ͠ ΫϥελϦϯά݁ՌΛௐࠪ • ϋϯΫɾΞʔϩϯ, ΟϦʔɾϝΠζ,
ήϨʔϩଞ, ࣅ͍ͯΔ֎ख͕औΕͨͷͰ ޭͱݴ͑ͦ͏🎉 ※ήϨʔϩڈΦΦλχαϯͱHRԦ૪͍ͨ͠ήϨʔϩJr.ͷ͓͞Μ
༧ଌͷग़͠ํ • ΫϥελϦϯάͷ݁Ռ, ্ҐʹϥϯΩϯά͞Εͨબखͷ ྸผΛऔಘ • ྸผͷฏۉύʔηϯλΠϧΛࢼͯ͠, ऩ·Γͷྑ͍ࣈʹ͢Δ
• ଧɾ҆ଧͳͲʮੵΈॏͶʯͷΛ༧ଌޙ, ଧͳͲͷʮʯΛද͢Λܭࢉ
ϓϩμΫτʹ͢Δ • ͻͱ·࣮ͣݧతͳΞϓϦέʔγϣϯΛ StreamlitͰ࣮ • StreamlitҰݴͰݴ͏ͱ ʮJupyter notebookΛΞϓϦʹ͢Δʯ
ͨΊͷFramework • Dockerίϯςφʹͯ͠ Cloud RunͰϗεςΟϯά
ಥવͰ͕͢””͍͍ͬͯͰ͔͢?
AIͰ͏ʮࠓ, ؾʹͳΔϓϩٿબखʯ • ݱࡏઈௐ, ޥͷ͋ͷਓ • ೋ಄ཽʢೋྲྀʣͤ͞Δඞཁ͋Δͷ͔ແ͍ͷ͔? • BIG BOSSʹࣅͯΔʢ͔͠Εͳ͍ʣ͋ͷબख
ຊ12ٿஂ৮Ε͍ͨ…Ͱ͕࣌ؒ͢ͷ߹ʹΑΓ🙏
ઈௐͳޥͷ͋ͷਓͱ͍͑ • ࡔ কޗʢౡʣ - 2016υϥϑτ4Ґ • ࡢ͍ͭʹϒϨΠΫ, ࠓ͜͜·Ͱଧരൃ •
ϝΠϯัख͕ͩकΕΔϢʔςΟϦςΟ
͜ΕΤά͍ະདྷ༧ਤʢੌʣ
ࡔ কޗબखͷະདྷ • ࠓͷ༧ʮଧ.309 ຊྥଧ20ຊ ଧ70 OPS .903ʯ • ڈͷงғؾ͔Β͢ΔͱϦΞϧʹୡՄೳͳ༧ײ͕!?
• ݸਓతʹͬͺัखͬͯ΄͍͠, νʔϜࣄͳΜ͚ͩΕͲ ʢଧͯΔัख͍Δ͚ͩͰΞυόϯςʔδେ͖͍ʣ
ཽͷະདྷΛ͏ - ೋਓͷཽઓ࢜ • AɾϚϧςΟωεʢதʣ - 2018ೖஂ • ࠜඌ ߉ʢதʣ
- 2018υϥϑτ1Ґ • ଧ͓ΑͼೋྲྀͰͪΐͬͱΛݺΜͰ͍ΔೋਓΛ͏
ཽͷະདྷ໌Δ͍͔?
AɾϚϧςΟωεબखͷະདྷ • ࠓͷ༧ʮଧ.290 ຊྥଧ10ຊ ଧ44 OPS .862ʯ • OPSҎ֎ຊؾͰୟ͖ग़ͦ͠͏ͳࣈͳؾ͕͢Δ? •
ཉΛݴ͑֎͡Όͳͯ͘ัखͰग़ͯ΄͍͠ ัखͰ͜Ε͚ͩଧͬͨΒࠓͷٿͩͱੌ͍͜ͱʹ
ͳΔ΄Ͳ?
ࠜඌ ߉બखͷະདྷ • ࠓͷ༧ʮଧ.244 ຊྥଧ1ຊ ଧ6 OPS .654ʯ 5ޙ·Ͱͷ༧ଌ…͏ʔʔΜ?
• ඇৗʹौ͍ධՁ, ೋྲྀΛࢼ͢ҙຯ༧ଌ͚ͩͩͱ͋Γͦ͏? • ൩ܕͱ৴͍ͨ͡, ͍͘ΒͳΜͰٿAIͷධՁ͕ौ͗͢? ͪͳΈʹ౻ݪ ګେʢϩοςʣͳ͔ͳ͔ौ͍ධՁʹ
BIG BOSSͷޙܧऀ୭ͩ? • ສ தਖ਼ʢຊϋϜʣ - 2018υϥϑτ4Ґ • ύϫʔͱεϐʔυ, ࡶ͞Λ݉Ͷἧ͑ͨϑΟδΧϧϞϯελʔ
ϑϧεΠϯάͰ͔ͬඈ͢ଧܸͱڧݞΛੜ͔ͨ͠कඋ ݱ࣌ͷBIG BOSSͦͷͷ • ࢲ, shinyorke͕ࠓ࠷ਪ͍ͯ͠Δϓϩٿબख
ࢥͬͨΑΓBIG BOSSͬΆ͞?
ສ தਖ਼બखͷະདྷ • ࠓͷ༧ʮଧ.252 ຊྥଧ18ຊ ଧ52 OPS .780ʯ • ϗϯτʹୟ͖ग़ͦ͠͏ͳࣈ,
ग़ػձ&ଧ࣍ୈͰ ͳΜͩͬͨΒຊྥଧ༧ଌ௨Γ͔ͨ͠͠Β͔͢? • 5ޙʹOPS.900͑Β͍͠ͷͰ, ͜ͷ͍ͨͬͯཉ͍͠
ͪͳΈʹ, ϓϩτλΠϓͰ࡞ͬͨ ผͷAIϞσϧ͕มͳ༧ଌͯ͠·ͨ͠ ʢࠓճVer.Ͱ͍͟͝·ͤΜʣ
ສ தਖ਼ͱBIG BOSS ଧ ຊྥଧ ଧ #*(#044ࡀ ʢɾࡕਆʣ
ຊ ଧ ສதਖ਼ࡀ ʢͷ༧ଌʣ ຊ ଧ ΊͬͪΌ৽ঙ߶ࢤબखΜʂʂʂ
͖͏AIͰBIG BOSSͷޙܧऀ, ݟ͚ͭ·ͨ͠ʢ͜ͳΈʣ
݁ͼ
͖͏AIͷ՝ͱ࣍ͷςʔϚ • ৽ਓબखͷ༧ଌ͕ʢϞσϧͷ্༷ʣͰ͖ͳ͍ • ݱϞσϧ௨ࢉϕʔεͰͷֶश&༧ଌͰ͋ΔͨΊ, ࣮ແ͍ϧʔΩʔͷ༧ଌ͕ग़དྷͳ͍ • ߴߍɾେֶͷΛͦͷ··͑…ͱ͍͏୯७ͳղܾ͕Ͱ͖ͳ͍ • Ҏ֎ͷઆ໌มΛՃ͍͑ͨ
• ͬͺΓτϥοΩϯάσʔλ͍͍ͨʂ͋ͱମ֨ͱ͔ • ຊϓϩٿͰΔखஈແ͍͕, ϝδϟʔϦʔάBaseball SavantͰ͍͚ΔͷͰҾ͖ଓ͖AIΛҭ͍͖͍ͯͯͨ • ख൛͕͋Μ·Γ͓͠Ζ͘ͳ͔ͬͨͷ͕չ͍͠ • ҰԠ͋ΔͷͰ͕͢, ඍົͩͬͨͷͰൃද߇͑·ͨ͠, ࠤʑ ࿕رͷະདྷ༧ਤݟͯΈ͍ͨͷͰ͏গ͕͠ΜΓ·͢. • ݱ࣮తʹ, ϓϩٿͰΓͳ͍ಛྔ͕͋Γ·ͯ͠…ϝδϟʔϦʔά൛े࣮༻ʹת͑ΔͷͰ͕͢😇
࣍ͷల։ • ͍ʢ༧ଌʣαΠτͷ্ཱͪ͛. σʔλͷݖརͱ͔ॾʑ্ख͘ղ্ܾͨ͠Ͱʢଟ͍͚Δͱࢥ͏ʣ. • ༧ଌΞϧΰϦζϜͷվྑ. ϝδϟʔϦʔά൛ͰτϥοΩϯάσʔλΛͬͨϞσϧͷ։ൃ. •
PyCon JP 2023ͱ͔, ϦΞϧ։࠵ͷBaseball Play StudyͰ·ͨձ͓͏.
ಥવͰ͕͢””͍͍ͬͯͰ͔͢? • ٿAIηΠόʔϝτϦΫεͱػցֶशͷԠ༻Ͱ࣮Մೳ • ٿAIBigQueryPythonͰ࡞ΕΔ • ัखัखΛΔ͖Ͱ, ϚϯνϡBIG BOSSͷޙܧऀ ·ͩ·ͩ༡΅͏ͱࢥ͍·͢ͷͰҾ͖ଓ͖ΑΖ͘͠ʂ
ήʔϜηοτ ͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ Shinichi Nakagawa(Twitter/Facebook/etc… @shinyorke)