Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【第1回】関東Kaggler会「データ分析コンペとの向き合い方」
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
takaito
September 24, 2023
1
4.2k
【第1回】関東Kaggler会「データ分析コンペとの向き合い方」
【第1回】関東Kaggler会のLT4: 「データ分析コンペとの向き合い方」の資料となります.
著作権を考慮して,実際に使用したものとは多少異なります.
takaito
September 24, 2023
Tweet
Share
More Decks by takaito
See All by takaito
LLM性能改善の実践知 - Kaggleでの学びを現場に活かす思考法 (書籍紹介資料)
takaito
2
610
【第5回】関東Kaggler会「2025年に開催されたkaggleコンペの振り返り」
takaito
3
1.1k
関西Kaggler会 交流会 in Osaka 2025#3
takaito
3
790
【atmaCup#20】振り返り会LT資料
takaito
0
840
【第4回】関東Kaggler会「The Correct Way to Use the Validation Score」
takaito
5
2.5k
【第3回】関東Kaggler会「NLPの変遷とNLPコンペの最新事情 〜進化する技術と変化する戦い方〜」
takaito
4
1.1k
【第2回】関東Kaggler会「How are you handling High Score Public Notebook?」
takaito
3
2.5k
関西Kaggler会 交流会 in Osaka 2024#2 データ分析コンペとの向き合い方 ver2
takaito
1
1k
Featured
See All Featured
Agile that works and the tools we love
rasmusluckow
331
21k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.6k
BBQ
matthewcrist
89
10k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
210
エンジニアに許された特別な時間の終わり
watany
106
240k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.1k
Mobile First: as difficult as doing things right
swwweet
225
10k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
The World Runs on Bad Software
bkeepers
PRO
72
12k
The agentic SEO stack - context over prompts
schlessera
0
680
WCS-LA-2024
lcolladotor
0
470
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
260
Transcript
関東kaggler会 2023/9/23 LT4: データ分析コンペへの向き合い方 takaito
1 大学の専攻: 自然言語処理 お仕事: クオンツアナリスト Kaggle: Competitions Expert Kaggle歴: 3年目に突入
(2021年~) データ分析スキルの向上を目的に様々なコンペに参加 社会人で時間があまり確保できないこともあり基本はソロ参加 @takaito0423 簡単な自己紹介
2 Kaggle楽しんでますか? ✔ 新しいスキルの習得 ✔ リーダーボードスコアの改善 ✔ 参加者とのディスカッションでの交流 ✔ チームを組んでの参加
etc...
3 いつか直面する挫折 ✔ 凡人には挫折を経験するタイミングが必ず訪れる
4 Kaggle悲しいときあるある ✔ notebookの提出が通らず,エラーが出続けるとき ✔ 渾身のアイデア(特徴量など)がまったくスコア改善に寄与しなかったとき ✔ 手元のCVスコアは良かったが,提出したLBスコアが最悪なとき ✔ 時間をかけたコンペでLBの順位は良かったが,最終順位が大幅に悪かったとき
✔ あと一歩のところでソロ金を逃したとき etc...
5 どのように向き合っていくか? ① バイアスなどをきちんと理解する ② 相対的な順位だけでなく,自身の成長にフォーカスする ③ チームを組んで参加する ④ 無理のないペースで取り組む
6 ① バイアスなどをきちんと理解する ✔ X(旧Twitter)などでは,好順位の人ほど投稿を行い,いいねなども付きやすい ✔ 強い人たちがチームを組んで参加しているため,ソロで上位に行くことは難しい ✔ 社会人で仕事終わりなどにコンペに参加している時点で氷山の中ではかなり上の方にいる ✔
将棋や野球などのように実力が分かれていない舞台であるという認識を持つ
7 ② 相対的な順位だけでなく,自身の成長にフォーカスする ✔ 新しいことにチャレンジし続けることは,たとえ順位に結びつかなくても自身の成長につながる ✔ コンペ序盤:似たような過去コンペを参考にしてみる ・ 自力でsubmitする ✔
コンペ中盤: ディスカッションに目を通す ・ 公開notebookの実装を理解し工夫を加える ✔ コンペ終了後: 上位解法に目を通したり,再現実装に挑戦してみる ・ 有志の振り返り会に参加してみる
8 ③ チームを組んで参加する ✔ チームでの参加はモチベーションを高めることにつながります ✔ 各々のアプローチが異なればensembleもかなり効いてくる傾向にあります (LBスコア0.75,070,0.70を混ぜることで0.80が出たりします)
9 ④ 無理のないペースで取り組む ✔ 脳のリソースを一定数とられて睡眠の質に影響を与える ✔ 実装に時間がかかり睡眠時間が削られる 国内にも様々なコンペプラットフォームが存在している! 疲れが蓄積されていく
10 【おまけ】 SNSの活用 ✔ 強い人たちが参加しているコンペや注目しているコンペを認知できる (地雷コンペ回避) ✔ 実力が拮抗するユーザーとつながることができる (切磋琢磨やチームマージ)
11 まとめ スコアが改善せず,気持ちがネガティブになったときには以下を思い出してください! ① バイアスなどをきちんと理解する ② 相対的な順位だけでなく,自身の成長にフォーカスする ③ チームを組んで参加する ④
無理のないペースで取り組む 参加者同士で切磋琢磨しながら自己成長を続けていくという経過を楽しむことを忘れずに! 努力を続けていれば,きっといつかは上位争いに参加できるようになると思います!!