Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Basketball Behavior Challenge 1st Place Solution
Search
Shotaro Ishihara
November 27, 2020
Technology
0
840
Basketball Behavior Challenge 1st Place Solution
「Sports Analyst Meetup #9」での発表資料
https://spoana.connpass.com/event/190699/
Shotaro Ishihara
November 27, 2020
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
記者・編集者との協働:情報技術が変えるニュースメディア / Kaishi PU 2024
upura
0
54
ニュースメディアにおける生成 AI の活用と開発 / UTokyo Lecture Business Introduction
upura
0
150
マルチモーダル AI 実装の課題と解決策 / Developer X Summit
upura
0
220
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
700
「巨人の肩の上」で自作ライブラリを作る技術 / pyconjp2024
upura
3
900
Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
upura
0
51
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
440
第19回YANSシンポジウムスポンサー資料 / yans2024-nikkei
upura
0
50
Quantifying Memorization of Domain-Specific Pre-trained Language Models using Japanese Newspaper and Paywalls
upura
0
64
Other Decks in Technology
See All in Technology
Fanstaの1年を大解剖! 一人SREはどこまでできるのか!?
syossan27
2
180
成果を出しながら成長する、アウトプット駆動のキャッチアップ術 / Output-driven catch-up techniques to grow while producing results
aiandrox
0
380
re:Invent をおうちで楽しんでみた ~CloudWatch のオブザーバビリティ機能がスゴい!/ Enjoyed AWS re:Invent from Home and CloudWatch Observability Feature is Amazing!
yuj1osm
0
140
Storage Browser for Amazon S3
miu_crescent
1
290
podman_update_2024-12
orimanabu
1
290
いまからでも遅くないコンテナ座学
nomu
0
130
生成AIをより賢く エンジニアのための RAG入門 - Oracle AI Jam Session #20
kutsushitaneko
4
290
20241218_今年はSLI/SLOの導入を頑張ってました!
zepprix
0
100
普通のエンジニアがLaravelコアチームメンバーになるまで
avosalmon
0
120
サイボウズフロントエンドエキスパートチームについて / FrontendExpert Team
cybozuinsideout
PRO
5
38k
TSKaigi 2024 の登壇から広がったコミュニティ活動について
tsukuha
0
170
多領域インシデントマネジメントへの挑戦:ハードウェアとソフトウェアの融合が生む課題/Challenge to multidisciplinary incident management: Issues created by the fusion of hardware and software
bitkey
PRO
2
120
Featured
See All Featured
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
4 Signs Your Business is Dying
shpigford
182
21k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
365
25k
Making Projects Easy
brettharned
116
6k
[RailsConf 2023] Rails as a piece of cake
palkan
53
5.1k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
810
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Automating Front-end Workflow
addyosmani
1366
200k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Transcript
Basketball Behavior Challenge 1位解法 Shotaro Ishihara, u++ (@upura0) Sports Analyst
Meetup #9 2020年12⽉13⽇ 1
本発表について 2019年12⽉〜2020年9⽉に開催されていた「Basketball Behavior Challenge: BBC2020」[1]の1位解法の紹介 時系列の座標データから「スクリーンプレイ」があったか否 かを判定するコンペ [1] https://competitions.codalab.org/competitions/23905 2
⾃⼰紹介 Shotaro Ishihara, u++ (@upura0) spoanaの運営メンバー 本業はメディア企業のデータサイエンティスト 本コンペは、spoana #7のLT発表で知った(アーカイブ[2]) 共著に『PythonではじめるKaggleスタートブック』(講談
社)[3] [2] https://www.youtube.com/channel/UCX1kD7i5JvvRIZdo9xjlakw [3] https://www.kspub.co.jp/book/detail/5190067.html 3
データの概要 frame scr_x scr_y usr_x usr_y uDF_x uDF_y bal_x bal_y
0 2.89 4.74 5.49 1.5 2.78 5.22 6.98 12.7 1 2.88 4.7 5.52 1.51 2.8 5.2 7.08 12.52 2 2.87 4.67 5.54 1.53 2.82 5.19 7.13 12.35 3 2.86 4.65 5.56 1.54 2.84 5.17 7.08 12.37 ... 学習⽤データセット(正例400、負例1128) テスト⽤データセット382 フレーム数は⼀定ではない 予測は0か1なので、予測値の閾値決定が必要 4
スコアの推移 5
機械学習の教師あり学習 [4] ⽯原ら, 『PythonではじめるKaggleスタートブック』, 講談社 6
最初のアプローチ 知識に基づき、予測に効きそうな7つの特徴量を抽出 . プレイヤー3⼈とボールの距離の最⼩値 C = 4 2 6 .
フレーム数 機械学習アルゴリズムには、過去実績から期待値が⼤きい 「LightGBM」を利⽤ 7
性能の向上のために 1位[5]と2位[6]の解法を⽐較 . 「tsfresh」による特徴抽出 . ニューラルネットワークの利⽤ . アンサンブル(複数の予測値の混ぜ合わせ) [5] https://github.com/upura/basketball-behavior-challenge
[6] https://github.com/takaiyuk/codalab-bbc2020 8
「tsfresh」による特徴抽出 特徴量の数: 11340 (4 agents * 2 dimensions + 6
distances between agents ) * 810 重要視された特徴量 9
ニューラルネットワーク 時系列の情報の最⼩値だけ使うと、情報を⼤きく失う 畳み込みニューラルネットワークを利⽤して、特徴を抽出 [7] https://www.mdpi.com/1424-8220/20/13/3697/htm 10
アンサンブル 複数の予測値の混ぜ合わせ 11
まとめ スポーツを題材にしたコンペは楽しい 知識を活かしてスコアが伸びていく 今はKaggleで「NFL 1st and Future - Impact Detection」[8]
が開催中 [8] https://www.kaggle.com/c/nfl-impact-detection 12