本当に簡単なkaggleの始め方@yukinagae
View Slide
自己紹介永江悠紀 @yukinagaeグロービス 2018/8~データサイエンティスト(Python/Go)経歴元Java/Scalaエンジニアオーストラリアでデータ分析を勉強 →今に至る最近はベイズ統計モデリングに興味ある(˘ω˘)スヤァ
Agenda1. kaggleとは?2. kaggleの仕組み3.やってみた(`・ω・´)3
1. kaggleとは?4
世界最大の機械学習・データ分析のコンペを主催するプラットフォーム5
つまり6
データサイエンティストの世界最強を決める大会7
kaggleの規模ユーザ数: 50万以上国: 190カ国以上らしい(`・ω・´)8
2. kaggleの仕組み9
大まかな流れ1.主催者(企業など)がコンペを主催するa.データを準備b.問題を定義する2.参加者は様々な手法を使ってベストなモデルを構築し、予測を提出するスコアやランキングが分かる3.主催者は、精度が高い予測に賞金を払う10
ということで11
3.早速kaggleをやってみた(`・ω・´)12
1.コンペを選ぶ13
例えばこのコンペ(`・ω・´)14
2.コンペの内容を読む1.概要:大まかに把握2.評価指標:これが一番大事(`・ω・´)3.賞金:できればほしいよね4.期限:時間厳守5.データ:だいたいCSVファイル(BigQueryも)15
3.他の参加者から学ぶ1.コード(kernel)2.ディスカッション(discussion)16
いろんな人がコードを載せてくれてるので助かるsee: Simple Exploration+Baseline - GA CustomerRevenue | Kaggle17
4.他の参加者の方法を真似てみるコードをパクってローカルPCで実行するだけの簡単なお仕事(`・ω・´)18
5.助け合う <= New!ちょうどライブラリのバージョンで上手く動作しなかったので、上手くいった方法を教え合う(`・ω・´)19
6.めんどくさいので人のコードをforkする20
forkしたコードを実行するだけ(`・ω・´)21
実行中22
7.予測を提出する23
8.スコアとランクを確認689位(全1,031チーム)ちーん(`・ω・´)24
結局言いたいのは25
パクった後が勝負26
まとめkaggleはデータサイエンティストのNo.1を決める大会とりあえず人のコードをパクって頑張るkaggleは沼(`・ω・´)27
参考資料Kaggle - WikipediaWhat is Kaggle, Why I Participate, What is theImpact?fast.ai · Making neural nets uncool againdeeplearning.ai: Announcing new Deep Learningcourses on Coursera28
おわり(`・ω・´)ようこそkaggle沼へ29
最後にいちおうWe're hiring!30