Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
kaggle入門
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
mizoo
July 12, 2021
Programming
110
0
Share
kaggle入門
有志の研究会で共有した資料です。
kaggleの参加者を増やすために参加方法から進め方まで共有しました。
mizoo
July 12, 2021
Other Decks in Programming
See All in Programming
Java 21/25 Virtual Threads 소개
debop
0
340
テレメトリーシグナルが導くパフォーマンス最適化 / Performance Optimization Driven by Telemetry Signals
seike460
PRO
2
220
RSAが破られる前に知っておきたい 耐量子計算機暗号(PQC)入門 / Intro to PQC: Preparing for the Post-RSA Era
mackey0225
3
130
Coding at the Speed of Thought: The New Era of Symfony Docker
dunglas
0
4.7k
実践CRDT
tamadeveloper
0
410
KagglerがMixSeekを触ってみた
morim
0
370
ネイティブアプリとWebフロントエンドのAPI通信ラッパーにおける共通化の勘所
suguruooki
0
250
Reactive ❤️ Loom: A Forbidden Love Story
franz1981
2
230
Mastering Event Sourcing: Your Parents Holidayed in Yugoslavia
super_marek
0
150
メッセージングを利用して時間的結合を分離しよう #phperkaigi
kajitack
3
570
CDK Deployのための ”反響定位”
watany
1
580
How Swift's Type System Guides AI Agents
koher
0
190
Featured
See All Featured
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
10k
Evolving SEO for Evolving Search Engines
ryanjones
0
180
It's Worth the Effort
3n
188
29k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Building Adaptive Systems
keathley
44
3k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
1k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
150
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.4k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
200
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Transcript
Kaggle入門講座 mizoo
0 MISSIONとGOAL 1 Kaggleとは 2 開催されているコンペ 3 深層学習でカバーできる範囲 4 深層学習
5 参加の流れ 6 スコアの上げ方 7 メダル入賞者の共通点 8 参加コンペの説明 9 おすすめリンク
0 MISSIONとGOAL Kaggleの始め方・進め方を伝え Kaggle人材を増やす Submitからランキング入りまで みんなに経験してもらう MISSION GOAL
1 Kaggleとは 制度 上位入賞者には賞金が与えられる TOP1%:金メダル TOP5%:銀メダル TOP10%:銅メダル 称号 銅2個以上でExpert 金1個、銀2個以上でMaster
金5個(1個はソロ)でGrandmaster Google主催の予測モデリング・分析手法関連プラットフォーム
2 開催されているコンペ 開催されているコンペは大きく5つに分けられる テーブル 予測 画像 自然言語 強化学習 位置特定 生存者分類
株価予測 細胞分離予測 画像分類 難易度分類 ネガポジ判定 ゲームAI エージェント作成
3 深層学習でカバーできる範囲 向き不向きがあるが、ほとんどのコンペで主流になっている テーブル 予測 画像 自然言語 強化学習 位置特定 生存者分類
株価予測 細胞分離予測 画像分類 難易度分類 ネガポジ判定 ゲームAI エージェント作成
4 深層学習 人間の脳に近いネットワークモデル 深層学習ライブラリ VS Google Facebook 特徴 ・カスタマイズ性が強い ・最新の情報は英語論文
・数学的な知識が必要(何となくでいい) ・計算資源(GPU)が必要 ライブラリ 主な流派はTF派とPytorch派に分かれる とりあえず好きなほうでよい 最終的に両方できるのがベスト
5 参加の流れ EDAからモデリングまでを行き来して行う EDA 前処理 モデリング Submit ・データの分布 ・ドメイン知識 ・予測結果との差
・特徴量作成 ・crossvalidation ・skfold ・gkflod ・メタデータ作成 ・Augmentation ・model ・batch size ・learning rate ・loss ・optimizer ・scheduler ・sub結果を確認 ・cv・lb相関確認
Baseline 基本的にシンプルイズベスト 余計なものが入っていると選択肢が狭まる おすすめはGMが作ったnotebook 情報の仕入れ方 過去のSolutionを読む Discussion、Codeを読みまくる そこに効いたテクニックが書いてあるので、それを 自分の処理に組み込む 6
スコアの上げ方 スコアアップのヒントはKaggleページ内にあり
7 メダル入賞者の共通点 データをよく見ている・試行回数が多い・一早く動いている
概要 カリフォルニア大学バークレー校は、世界で最も 強力な望遠鏡を使って数百万個の星をスキャ ンし、テクノロジーの痕跡を探しています 今回はそのテクノロジーの痕跡をスキャン画像か ら検知します データ量 67G タスク 画像分類
8 参加コンペの説明 SETI: 宇宙人のシグナルを検知するコンペ https://www.kaggle.com/c/seti-breakthrough-listen/overview
EDA https://www.kaggle.com/ihelon/signal-search-exploratory-data-analysis Baseline https://www.kaggle.com/yasufuminakama/seti-nfnet-l0-starter-training 困ったときのリンク https://github.com/phalanx- hk/kaggle_cv_pipeline/blob/master/kaggle_tips.md#ml_experiment 9 おすすめリンク