Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
テキストマイニングによるプロ野球の順位予想 / Baseball Play Study 202...
Search
7pairs
December 17, 2020
Technology
0
500
テキストマイニングによるプロ野球の順位予想 / Baseball Play Study 2020 Winter
Baseball Play Study 2020 冬 シーズン振返りスペシャル (BPStudy#160)
の資料です。
7pairs
December 17, 2020
Tweet
Share
More Decks by 7pairs
See All by 7pairs
Privacy Sandbox on Android / DroidKaigi 2024
7pairs
1
740
2020年の振り返りとBaseball Play Studyの振り返り / Jisyupy 29
7pairs
0
320
Because Python is there. / Jisyupy 27
7pairs
0
460
野球好きのための快適なプレゼンテーション環境の構築 / Baseball Play Study 2019 Winter
7pairs
0
1k
ちゃんと実装してちゃんとテストしよう / PyCon mini Hiroshima 2019
7pairs
2
940
Pie Meets Py / PyCon JP 2019
7pairs
3
5.5k
テキストマイニングによる新外国人選手の分析 / Baseball Play Study 2019 Spring
7pairs
0
2.8k
テキストマイニングによる応援歌の分析 / Baseball Play Study 2018 Winter
7pairs
0
2.2k
altJSとしてのPython / PyCon JP 2018
7pairs
2
2.7k
Other Decks in Technology
See All in Technology
ブラウザのレガシー・独自機能を愛でる-Firefoxの脆弱性4選- / Browser Crash Club #1
masatokinugawa
1
500
“パスワードレス認証への道" ユーザー認証の変遷とパスキーの関係
ritou
1
610
アジャイル脅威モデリング#1(脅威モデリングナイト#8)
masakane55
3
230
彩の国で始めよう。おっさんエンジニアから共有したい、当たり前のことを当たり前にする技術
otsuki
0
150
バクラクの認証基盤の成長と現在地 / bakuraku-authn-platform
convto
2
640
SmartHR プロダクトエンジニア求人ガイド_2025 / PdE job guide 2025
smarthr
0
130
SnowflakeとDatabricks両方でRAGを構築してみた
kameitomohiro
1
440
アセスメントで紐解く、10Xのデータマネジメントの軌跡
10xinc
1
440
2025-04-24 "Manga AI Understanding & Localization" Furukawa Arata (CyberAgent, Inc)
ornew
2
230
30代からでも遅くない! 内製開発の世界に飛び込み、最前線で戦うLLMアプリ開発エンジニアになろう
minorun365
PRO
12
4k
От ручной разметки к LLM: как мы создавали облако тегов в Lamoda. Анастасия Ангелова, Data Scientist, Lamoda Tech
lamodatech
0
770
クォータ監視、AWS Organizations環境でも楽勝です✌️
iwamot
PRO
1
330
Featured
See All Featured
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
23
2.6k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
32
5.4k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
4 Signs Your Business is Dying
shpigford
183
22k
Into the Great Unknown - MozCon
thekraken
37
1.7k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
9
760
We Have a Design System, Now What?
morganepeng
52
7.5k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
119
51k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
The Cult of Friendly URLs
andyhume
78
6.3k
The Language of Interfaces
destraynor
157
25k
Transcript
ςΩετϚΠχϯάʹΑΔ ϓϩٿͷॱҐ༧ ୩ ५ / 2020-12-17 Baseball Play Study 2020ౙ
(BPStudy#160)
ͨΓোΓͷͳ͍ࣗݾհ • ୩ ५ (ͤ ͡ΎΜ) • Twitter / GitHubͰ
7pairs Ͱ׆ಈத • ࣗশAndroidΤϯδχΞ • Apple༷ͷؾ·͙ΕʹৼΓճ͞ΕͯࠓiOS͔͠৮͍ͬͯͳ͍ • ͖ͳϓϩάϥϛϯάݴޠ • PythonɼClojure • ৯ΔͨΊͷϓϩάϥϛϯάݴޠ • JavaɼObjective-CɼC#ɼJavaScript...
ͨΓোΓͷ͋Δࣗݾհ • ͖ͳٿ༻ޠ • FAݖΛߦͯ͠ཹɼੜ֔ϥΠΦϯζ • ͖ͩͬͨνϟϯς4 • ळࢁͷલ͔ΒྲྀΕΔΑ͏ʹҠߦ͢Δνϟϯς4 •
͖ͳελδΞϜάϧϝ • ࢰࢠϦΞϯϥΠεɼ3݄4݄10݄11݄ͷڱࢁ௮͚ɼ6݄7݄8݄ͷྫྷౚΈ͔Μ • ͖ͳ҉ࠇΫϦʔϯΞοϓτϦΦ • 3൪ϥΠτখؔɼ4൪ϑΝʔετླɼ5൪αʔυγΞϯϑϩοί (1999։ນઓ)
ຊͷΰʔϧ • ʮࣗԿ͔ͷੳΛ͍ͨ͠ʂʯͱ͍͏ؾ࣋ͪʹͳ͍ͬͯͨͩ͘ • ࡛ۄϥΠΦϯζͷެࣜΏΔΩϟϥͰ͋Δ Β͍ʹΐΜ͘Μͷ͔Θ͍͞Λཧղ͍ͯͨͩ͘͠
Β͍ʹΐΜ͘Μ͔Θ͍͍ʂ
ʹ΄Μ͠Γʔͣͬͯͳʹʁ
͘͞Β͖Ε͍ʔ
ΊΖΜͺʔΜ
͋ͬΔͺʔΜͪ
BPStudyͬΆ͍ٕज़ͷ
ςΩετϚΠχϯάͰॱҐΛ༧͢Δ • εϙʔπ৽ฉͷهࣄσʔλΛίʔύεͱ͠ɺword2vecͰ୯ޠΛϕΫτϧԽ • શࠃࢴࡿԼͷ4ࢴ͕ର (Ϧʔά༏উܾఆཌʹDT͕Ұ໘ʹདྷΔͷࢴ໘ͷެฏੑʹ͚ܽΔͨΊ) • αϯέΠεϙʔπ • εϙʔπχοϙϯ
• εϙʔπใ • ץεϙʔπ • 201910݄24 (ຊγϦʔζऴྃཌ) ͔Β20206݄18 (։ນલ) ͷهࣄ͕ର • νʔϜ໊Λ୯ޠͱͯ͠ͱΒ͑ɺʮ༏উʯͱͷྨࣅ͕ߴ͍ॱʹॱҐ͚
هࣄͷऩूํ๏ (20201݄͝Ζ·Ͱ) • εϙʔπ৽ฉͷαΠτΛఆظతʹΫϩʔϦϯά / εΫϨΠϐϯά • ScrapyΛར༻ • ݁ՌςΩετϑΝΠϧͱͯ͠Amazon
S3ʹอଘ • هࣄͷݕࡧͷͨΊʹElasticsearchʹσʔλΛొ • ੲͷهࣄ͕ඞཁʹͳͬͨ߹༗ྉαʔϏεͰߪೖ
2ճ͔͠ੳ͠ͳ͍ͷʹ ͓ۚΛ͔͚͗͢Ͱʁ
ίετݮʹ͚ͯ • ຊʹϦΞϧλΠϜͰ࣮ߦ͢Δඞཁ͕͋ΔͷΫϩʔϦϯά͚ͩ • ͕࣌ؒܦա͢ΔͱهࣄΛτοϓϖʔδ͔ΒḷΕͳ͘ͳΔͨΊ • εΫϨΠϐϯάҎ߱ੳͷલॲཧͱͯ͠खݩͰ࣮ࢪ͢Δ • ͜͜·ͰػೳΛߜΕαʔόʔϨεԽՄೳ •
Amazon S3Ҏ֎ແྉͰेߦ͚ͦ͏
هࣄͷऩूํ๏ (20202݄͝Ζ͔Β) • εϙʔπࢴͷαΠτΛఆظతʹΫϩʔϦϯά • AWS Lambda (Python) Λར༻ •
هࣄҰཡϖʔδΛղੳ͠ɺ֤هࣄϖʔδͷURLΛऔಘ • هࣄϖʔδੜHTMLͷ··S3ʹอଘ • ΫϩʔϦϯά࣮ࢪ࣌ͳͲɺཧ༻ͷใΛDynamoDBʹొ
ऩूج൫Λஔ͖͑ͨ݁Ռ͆͆͆͆͆
Ұ෦ͷσʔλΛ͏͔ͬΓ S3 GlacierʹҠಈ͍ͯͨͨ͠Ί Ή͠Ζ߹ܭίετ͕૿Ճ͠·ͨ͠
͓ͷΕGlacierΊ (ٯ࠘Έ)
άϥγΞϧ͡Όͳ͍Ͱ͢
݁Ռൃද
ηɾϦʔάॱҐ༧ / ݁Ռ ॱҐ ༧ ݁Ռ ಡച ಡച উഊ
ࡕਆ ࡕਆ উഊ ԣ%F/" த উഊ ౡ౦༸ ԣ%F/" উഊ த ౡ౦༸ উഊ ౦ژϠΫϧτ ౦ژϠΫϧτ উഊ
ύɾϦʔάॱҐ༧ / ݁Ռ ॱҐ ༧ ݁Ռ ԬιϑτόϯΫ ԬιϑτόϯΫ উഊ
౦ָఱ ઍ༿ϩος উഊ ઍ༿ϩος ࡛ۄ উഊ ւಓຊϋϜ ౦ָఱ উഊ ΦϦοΫε ւಓຊϋϜ উഊ ࡛ۄ ΦϦοΫε উഊ
(ΞΧϯ)
Ͱ͜ͷॱ൪ΛͲ͔͜ͰݟͨΑ͏ͳ
ผͷϥϯΩϯάͱൺֱͯ͠Έͨ
ηɾϦʔάಘࣦࠩ ॱҐ ॱҐ༧ ݁Ռ ಡച ಡച ࡕਆ
ԣ%F/" ԣ%F/" ࡕਆ ౡ౦༸ ౡ౦༸ த த ౦ژϠΫϧτ ౦ژϠΫϧτ
ύɾϦʔάಘࣦࠩ ॱҐ ॱҐ༧ ݁Ռ ԬιϑτόϯΫ ԬιϑτόϯΫ ౦ָఱ
౦ָఱ ઍ༿ϩος ઍ༿ϩος ւಓຊϋϜ ւಓຊϋϜ ΦϦοΫε ΦϦοΫε ࡛ۄ ࡛ۄ
ߦ͚ΔΜʂ (ͱͱॱҐ༧ͩͬͨͱ͍͏ࣄ࣮͔ΒΛͦΒ͠ͳ͕Β)
·ͱΊ
໌͔Βऩू / ੳΛ͢ΔͨΊʹ • Ճ౻ߞଠ (2019) PythonΫϩʔϦϯάˍεΫϨΠϐϯά [૿ิվగ൛] —
σʔλऩूɾղੳͷͨΊͷ࣮ફ։ൃΨΠυ ٕज़ධࣾ • ຊڮஐޫ (2018) લॲཧେશ — σʔλੳͷͨΊͷSQL/R/Python࣮ફςΫχοΫ ٕज़ධࣾ • ඌହ (2014) word2vecʹΑΔࣗવݴޠॲཧ ΦϥΠϦʔɾδϟύϯ
໌͔ΒσʔλͷऩूΛ࢝ΊΕ 1ޙʹ1ͷσʔλ͕ੵ͞Ε·͢
·ͱΊ • word2vecʹΑΔੳͰཌγʔζϯͷಘࣦࠩॱҐΛ ͋Δఔͷਫ਼ͰٻΊΔ͜ͱ͕Ͱ͖ͨ • Amazon S3ͷBucketͷઃఆʹࡉ৺ͷҙΛ͓͏ • কདྷͷࣗͷͨΊʹσʔλΛऩू͠Α͏
• Β͍ʹΐΜ͘Μ͔Θ͍͍ʂ
͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ དྷγʔζϯΑΖ͓͘͠ئ͍͠·͢