Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
テキストマイニングによるプロ野球の順位予想 / Baseball Play Study 202...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
7pairs
December 17, 2020
Technology
0
550
テキストマイニングによるプロ野球の順位予想 / Baseball Play Study 2020 Winter
Baseball Play Study 2020 冬 シーズン振返りスペシャル (BPStudy#160)
の資料です。
7pairs
December 17, 2020
Tweet
Share
More Decks by 7pairs
See All by 7pairs
Pythonによる契約プログラミング入門 / PyCon JP 2025
7pairs
7
3.7k
Privacy Sandbox on Android / DroidKaigi 2024
7pairs
1
1k
2020年の振り返りとBaseball Play Studyの振り返り / Jisyupy 29
7pairs
0
360
Because Python is there. / Jisyupy 27
7pairs
0
500
野球好きのための快適なプレゼンテーション環境の構築 / Baseball Play Study 2019 Winter
7pairs
0
1.1k
ちゃんと実装してちゃんとテストしよう / PyCon mini Hiroshima 2019
7pairs
2
1k
Pie Meets Py / PyCon JP 2019
7pairs
3
5.8k
テキストマイニングによる新外国人選手の分析 / Baseball Play Study 2019 Spring
7pairs
0
3k
テキストマイニングによる応援歌の分析 / Baseball Play Study 2018 Winter
7pairs
0
2.3k
Other Decks in Technology
See All in Technology
[CV勉強会@関東 World Model 読み会] Orbis: Overcoming Challenges of Long-Horizon Prediction in Driving World Models (Mousakhan+, NeurIPS 2025)
abemii
0
130
ブロックテーマ、WordPress でウェブサイトをつくるということ / 2026.02.07 Gifu WordPress Meetup
torounit
0
180
クレジットカード決済基盤を支えるSRE - 厳格な監査とSRE運用の両立 (SRE Kaigi 2026)
capytan
6
2.7k
OCI Database Management サービス詳細
oracle4engineer
PRO
1
7.4k
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
410
レガシー共有バッチ基盤への挑戦 - SREドリブンなリアーキテクチャリングの取り組み
tatsukoni
0
210
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
外部キー制約の知っておいて欲しいこと - RDBMSを正しく使うために必要なこと / FOREIGN KEY Night
soudai
PRO
12
5.4k
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
450
AIと新時代を切り拓く。これからのSREとメルカリIBISの挑戦
0gm
0
910
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.3k
Greatest Disaster Hits in Web Performance
guaca
0
230
Featured
See All Featured
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
96
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
66
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
Are puppies a ranking factor?
jonoalderson
1
2.7k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
85
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
440
SEO for Brand Visibility & Recognition
aleyda
0
4.2k
Producing Creativity
orderedlist
PRO
348
40k
Transcript
ςΩετϚΠχϯάʹΑΔ ϓϩٿͷॱҐ༧ ୩ ५ / 2020-12-17 Baseball Play Study 2020ౙ
(BPStudy#160)
ͨΓোΓͷͳ͍ࣗݾհ • ୩ ५ (ͤ ͡ΎΜ) • Twitter / GitHubͰ
7pairs Ͱ׆ಈத • ࣗশAndroidΤϯδχΞ • Apple༷ͷؾ·͙ΕʹৼΓճ͞ΕͯࠓiOS͔͠৮͍ͬͯͳ͍ • ͖ͳϓϩάϥϛϯάݴޠ • PythonɼClojure • ৯ΔͨΊͷϓϩάϥϛϯάݴޠ • JavaɼObjective-CɼC#ɼJavaScript...
ͨΓোΓͷ͋Δࣗݾհ • ͖ͳٿ༻ޠ • FAݖΛߦͯ͠ཹɼੜ֔ϥΠΦϯζ • ͖ͩͬͨνϟϯς4 • ळࢁͷલ͔ΒྲྀΕΔΑ͏ʹҠߦ͢Δνϟϯς4 •
͖ͳελδΞϜάϧϝ • ࢰࢠϦΞϯϥΠεɼ3݄4݄10݄11݄ͷڱࢁ௮͚ɼ6݄7݄8݄ͷྫྷౚΈ͔Μ • ͖ͳ҉ࠇΫϦʔϯΞοϓτϦΦ • 3൪ϥΠτখؔɼ4൪ϑΝʔετླɼ5൪αʔυγΞϯϑϩοί (1999։ນઓ)
ຊͷΰʔϧ • ʮࣗԿ͔ͷੳΛ͍ͨ͠ʂʯͱ͍͏ؾ࣋ͪʹͳ͍ͬͯͨͩ͘ • ࡛ۄϥΠΦϯζͷެࣜΏΔΩϟϥͰ͋Δ Β͍ʹΐΜ͘Μͷ͔Θ͍͞Λཧղ͍ͯͨͩ͘͠
Β͍ʹΐΜ͘Μ͔Θ͍͍ʂ
ʹ΄Μ͠Γʔͣͬͯͳʹʁ
͘͞Β͖Ε͍ʔ
ΊΖΜͺʔΜ
͋ͬΔͺʔΜͪ
BPStudyͬΆ͍ٕज़ͷ
ςΩετϚΠχϯάͰॱҐΛ༧͢Δ • εϙʔπ৽ฉͷهࣄσʔλΛίʔύεͱ͠ɺword2vecͰ୯ޠΛϕΫτϧԽ • શࠃࢴࡿԼͷ4ࢴ͕ର (Ϧʔά༏উܾఆཌʹDT͕Ұ໘ʹདྷΔͷࢴ໘ͷެฏੑʹ͚ܽΔͨΊ) • αϯέΠεϙʔπ • εϙʔπχοϙϯ
• εϙʔπใ • ץεϙʔπ • 201910݄24 (ຊγϦʔζऴྃཌ) ͔Β20206݄18 (։ນલ) ͷهࣄ͕ର • νʔϜ໊Λ୯ޠͱͯ͠ͱΒ͑ɺʮ༏উʯͱͷྨࣅ͕ߴ͍ॱʹॱҐ͚
هࣄͷऩूํ๏ (20201݄͝Ζ·Ͱ) • εϙʔπ৽ฉͷαΠτΛఆظతʹΫϩʔϦϯά / εΫϨΠϐϯά • ScrapyΛར༻ • ݁ՌςΩετϑΝΠϧͱͯ͠Amazon
S3ʹอଘ • هࣄͷݕࡧͷͨΊʹElasticsearchʹσʔλΛొ • ੲͷهࣄ͕ඞཁʹͳͬͨ߹༗ྉαʔϏεͰߪೖ
2ճ͔͠ੳ͠ͳ͍ͷʹ ͓ۚΛ͔͚͗͢Ͱʁ
ίετݮʹ͚ͯ • ຊʹϦΞϧλΠϜͰ࣮ߦ͢Δඞཁ͕͋ΔͷΫϩʔϦϯά͚ͩ • ͕࣌ؒܦա͢ΔͱهࣄΛτοϓϖʔδ͔ΒḷΕͳ͘ͳΔͨΊ • εΫϨΠϐϯάҎ߱ੳͷલॲཧͱͯ͠खݩͰ࣮ࢪ͢Δ • ͜͜·ͰػೳΛߜΕαʔόʔϨεԽՄೳ •
Amazon S3Ҏ֎ແྉͰेߦ͚ͦ͏
هࣄͷऩूํ๏ (20202݄͝Ζ͔Β) • εϙʔπࢴͷαΠτΛఆظతʹΫϩʔϦϯά • AWS Lambda (Python) Λར༻ •
هࣄҰཡϖʔδΛղੳ͠ɺ֤هࣄϖʔδͷURLΛऔಘ • هࣄϖʔδੜHTMLͷ··S3ʹอଘ • ΫϩʔϦϯά࣮ࢪ࣌ͳͲɺཧ༻ͷใΛDynamoDBʹొ
ऩूج൫Λஔ͖͑ͨ݁Ռ͆͆͆͆͆
Ұ෦ͷσʔλΛ͏͔ͬΓ S3 GlacierʹҠಈ͍ͯͨͨ͠Ί Ή͠Ζ߹ܭίετ͕૿Ճ͠·ͨ͠
͓ͷΕGlacierΊ (ٯ࠘Έ)
άϥγΞϧ͡Όͳ͍Ͱ͢
݁Ռൃද
ηɾϦʔάॱҐ༧ / ݁Ռ ॱҐ ༧ ݁Ռ ಡച ಡച উഊ
ࡕਆ ࡕਆ উഊ ԣ%F/" த উഊ ౡ౦༸ ԣ%F/" উഊ த ౡ౦༸ উഊ ౦ژϠΫϧτ ౦ژϠΫϧτ উഊ
ύɾϦʔάॱҐ༧ / ݁Ռ ॱҐ ༧ ݁Ռ ԬιϑτόϯΫ ԬιϑτόϯΫ উഊ
౦ָఱ ઍ༿ϩος উഊ ઍ༿ϩος ࡛ۄ উഊ ւಓຊϋϜ ౦ָఱ উഊ ΦϦοΫε ւಓຊϋϜ উഊ ࡛ۄ ΦϦοΫε উഊ
(ΞΧϯ)
Ͱ͜ͷॱ൪ΛͲ͔͜ͰݟͨΑ͏ͳ
ผͷϥϯΩϯάͱൺֱͯ͠Έͨ
ηɾϦʔάಘࣦࠩ ॱҐ ॱҐ༧ ݁Ռ ಡച ಡച ࡕਆ
ԣ%F/" ԣ%F/" ࡕਆ ౡ౦༸ ౡ౦༸ த த ౦ژϠΫϧτ ౦ژϠΫϧτ
ύɾϦʔάಘࣦࠩ ॱҐ ॱҐ༧ ݁Ռ ԬιϑτόϯΫ ԬιϑτόϯΫ ౦ָఱ
౦ָఱ ઍ༿ϩος ઍ༿ϩος ւಓຊϋϜ ւಓຊϋϜ ΦϦοΫε ΦϦοΫε ࡛ۄ ࡛ۄ
ߦ͚ΔΜʂ (ͱͱॱҐ༧ͩͬͨͱ͍͏ࣄ࣮͔ΒΛͦΒ͠ͳ͕Β)
·ͱΊ
໌͔Βऩू / ੳΛ͢ΔͨΊʹ • Ճ౻ߞଠ (2019) PythonΫϩʔϦϯάˍεΫϨΠϐϯά [૿ิվగ൛] —
σʔλऩूɾղੳͷͨΊͷ࣮ફ։ൃΨΠυ ٕज़ධࣾ • ຊڮஐޫ (2018) લॲཧେશ — σʔλੳͷͨΊͷSQL/R/Python࣮ફςΫχοΫ ٕज़ධࣾ • ඌହ (2014) word2vecʹΑΔࣗવݴޠॲཧ ΦϥΠϦʔɾδϟύϯ
໌͔ΒσʔλͷऩूΛ࢝ΊΕ 1ޙʹ1ͷσʔλ͕ੵ͞Ε·͢
·ͱΊ • word2vecʹΑΔੳͰཌγʔζϯͷಘࣦࠩॱҐΛ ͋Δఔͷਫ਼ͰٻΊΔ͜ͱ͕Ͱ͖ͨ • Amazon S3ͷBucketͷઃఆʹࡉ৺ͷҙΛ͓͏ • কདྷͷࣗͷͨΊʹσʔλΛऩू͠Α͏
• Β͍ʹΐΜ͘Μ͔Θ͍͍ʂ
͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ དྷγʔζϯΑΖ͓͘͠ئ͍͠·͢