Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Basketball Behavior Challenge 1st Place Solution
Search
Shotaro Ishihara
November 27, 2020
Technology
0
840
Basketball Behavior Challenge 1st Place Solution
「Sports Analyst Meetup #9」での発表資料
https://spoana.connpass.com/event/190699/
Shotaro Ishihara
November 27, 2020
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
記者・編集者との協働:情報技術が変えるニュースメディア / Kaishi PU 2024
upura
0
59
ニュースメディアにおける生成 AI の活用と開発 / UTokyo Lecture Business Introduction
upura
0
180
マルチモーダル AI 実装の課題と解決策 / Developer X Summit
upura
0
240
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
740
「巨人の肩の上」で自作ライブラリを作る技術 / pyconjp2024
upura
3
940
Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
upura
0
57
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
460
第19回YANSシンポジウムスポンサー資料 / yans2024-nikkei
upura
0
58
Quantifying Memorization of Domain-Specific Pre-trained Language Models using Japanese Newspaper and Paywalls
upura
0
70
Other Decks in Technology
See All in Technology
AI×医用画像の現状と可能性_2024年版/AI×medical_imaging_in_japan_2024
tdys13
1
1.3k
Oracle Exadata Database Service(Dedicated Infrastructure):サービス概要のご紹介
oracle4engineer
PRO
0
12k
スケールし続ける事業とサービスを支える組織とアーキテクチャの生き残り戦略 / The survival strategy for Money Forward’s engineering.
moneyforward
0
250
When Windows Meets Kubernetes…
pichuang
0
270
20250116_JAWS_Osaka
takuyay0ne
2
160
駆け出しリーダーとしての第一歩〜開発チームとの新しい関わり方〜 / Beginning Journey as Team Leader
kaonavi
0
110
Bring Your Own Container: When Containers Turn the Key to EDR Bypass/byoc-avtokyo2024
tkmru
0
770
Alignment and Autonomy in Cybozu - 300人の開発組織でアラインメントと自律性を両立させるアジャイルな組織運営 / RSGT2025
ama_ch
1
2.1k
WantedlyでのKotlin Multiplatformの導入と課題 / Kotlin Multiplatform Implementation and Challenges at Wantedly
kubode
0
200
FODにおけるホーム画面編成のレコメンド
watarukudo
PRO
2
100
実践! ソフトウェアエンジニアリングの価値の計測 ── Effort、Output、Outcome、Impact
nomuson
0
1.8k
AWS re:Invent 2024 ふりかえり勉強会
yhana
0
710
Featured
See All Featured
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
29
2.1k
Why Our Code Smells
bkeepers
PRO
335
57k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Building a Scalable Design System with Sketch
lauravandoore
460
33k
Optimizing for Happiness
mojombo
376
70k
Fireside Chat
paigeccino
34
3.1k
Speed Design
sergeychernyshev
25
730
Learning to Love Humans: Emotional Interface Design
aarron
274
40k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Designing Experiences People Love
moore
139
23k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
6
490
Transcript
Basketball Behavior Challenge 1位解法 Shotaro Ishihara, u++ (@upura0) Sports Analyst
Meetup #9 2020年12⽉13⽇ 1
本発表について 2019年12⽉〜2020年9⽉に開催されていた「Basketball Behavior Challenge: BBC2020」[1]の1位解法の紹介 時系列の座標データから「スクリーンプレイ」があったか否 かを判定するコンペ [1] https://competitions.codalab.org/competitions/23905 2
⾃⼰紹介 Shotaro Ishihara, u++ (@upura0) spoanaの運営メンバー 本業はメディア企業のデータサイエンティスト 本コンペは、spoana #7のLT発表で知った(アーカイブ[2]) 共著に『PythonではじめるKaggleスタートブック』(講談
社)[3] [2] https://www.youtube.com/channel/UCX1kD7i5JvvRIZdo9xjlakw [3] https://www.kspub.co.jp/book/detail/5190067.html 3
データの概要 frame scr_x scr_y usr_x usr_y uDF_x uDF_y bal_x bal_y
0 2.89 4.74 5.49 1.5 2.78 5.22 6.98 12.7 1 2.88 4.7 5.52 1.51 2.8 5.2 7.08 12.52 2 2.87 4.67 5.54 1.53 2.82 5.19 7.13 12.35 3 2.86 4.65 5.56 1.54 2.84 5.17 7.08 12.37 ... 学習⽤データセット(正例400、負例1128) テスト⽤データセット382 フレーム数は⼀定ではない 予測は0か1なので、予測値の閾値決定が必要 4
スコアの推移 5
機械学習の教師あり学習 [4] ⽯原ら, 『PythonではじめるKaggleスタートブック』, 講談社 6
最初のアプローチ 知識に基づき、予測に効きそうな7つの特徴量を抽出 . プレイヤー3⼈とボールの距離の最⼩値 C = 4 2 6 .
フレーム数 機械学習アルゴリズムには、過去実績から期待値が⼤きい 「LightGBM」を利⽤ 7
性能の向上のために 1位[5]と2位[6]の解法を⽐較 . 「tsfresh」による特徴抽出 . ニューラルネットワークの利⽤ . アンサンブル(複数の予測値の混ぜ合わせ) [5] https://github.com/upura/basketball-behavior-challenge
[6] https://github.com/takaiyuk/codalab-bbc2020 8
「tsfresh」による特徴抽出 特徴量の数: 11340 (4 agents * 2 dimensions + 6
distances between agents ) * 810 重要視された特徴量 9
ニューラルネットワーク 時系列の情報の最⼩値だけ使うと、情報を⼤きく失う 畳み込みニューラルネットワークを利⽤して、特徴を抽出 [7] https://www.mdpi.com/1424-8220/20/13/3697/htm 10
アンサンブル 複数の予測値の混ぜ合わせ 11
まとめ スポーツを題材にしたコンペは楽しい 知識を活かしてスコアが伸びていく 今はKaggleで「NFL 1st and Future - Impact Detection」[8]
が開催中 [8] https://www.kaggle.com/c/nfl-impact-detection 12