Slide 1

Slide 1 text

本当に簡単なkaggle の始め方 @yukinagae

Slide 2

Slide 2 text

自己紹介 永江悠紀 @yukinagae グロービス 2018/8 ~ データサイエンティスト(Python/Go) 経歴 元Java/Scala エンジニア オーストラリアでデータ分析を勉強 → 今に至る 最近はベイズ統計モデリングに興味ある(˘ω˘) スヤァ

Slide 3

Slide 3 text

Agenda 1. kaggle とは? 2. kaggle の仕組み 3. やってみた( `・ω ・´) 3

Slide 4

Slide 4 text

1. kaggle とは? 4

Slide 5

Slide 5 text

世界最大の機械学習・データ分析の コンペを主催するプラットフォーム 5

Slide 6

Slide 6 text

つまり 6

Slide 7

Slide 7 text

データサイエンティストの 世界最強を決める大会 7

Slide 8

Slide 8 text

kaggle の規模 ユーザ数: 50 万以上 国: 190 カ国以上 らしい( `・ω ・´) 8

Slide 9

Slide 9 text

2. kaggle の仕組み 9

Slide 10

Slide 10 text

大まかな流れ 1. 主催者(企業など)がコンペを主催する a. データを準備 b. 問題を定義する 2. 参加者は様々な手法を使ってベストなモデルを構 築し、予測を提出する スコアやランキングが分かる 3. 主催者は、精度が高い予測に賞金を払う 10

Slide 11

Slide 11 text

ということで 11

Slide 12

Slide 12 text

3. 早速kaggle をやってみた ( `・ω ・´) 12

Slide 13

Slide 13 text

1. コンペを選ぶ 13

Slide 14

Slide 14 text

例えばこのコンペ( `・ω ・´) 14

Slide 15

Slide 15 text

2. コンペの内容を読む 1. 概要: 大まかに把握 2. 評価指標: これが一番大事( `・ω ・´) 3. 賞金: できればほしいよね 4. 期限: 時間厳守 5. データ: だいたいCSV ファイル(BigQuery も) 15

Slide 16

Slide 16 text

3. 他の参加者から学ぶ 1. コード(kernel ) 2. ディスカッション(discussion ) 16

Slide 17

Slide 17 text

いろんな人がコードを載せてくれてるので助かる see: Simple Exploration+Baseline - GA Customer Revenue | Kaggle 17

Slide 18

Slide 18 text

4. 他の参加者の方法を真似てみる コードをパクってローカルPC で実行するだけの簡単 なお仕事( `・ω ・´) 18

Slide 19

Slide 19 text

5. 助け合う <= New! ちょうどライブラリのバージョンで上手く動作しなか ったので、上手くいった方法を教え合う( `・ω ・´) 19

Slide 20

Slide 20 text

6. めんどくさいので人のコードを fork する 20

Slide 21

Slide 21 text

fork したコードを実行するだけ( `・ω ・´) 21

Slide 22

Slide 22 text

実行中 22

Slide 23

Slide 23 text

7. 予測を提出する 23

Slide 24

Slide 24 text

8. スコアとランクを確認 689 位(全1,031 チーム) ちーん( `・ω ・´) 24

Slide 25

Slide 25 text

結局言いたいのは 25

Slide 26

Slide 26 text

パクった後が勝負 26

Slide 27

Slide 27 text

まとめ kaggle はデータサイエンティストのNo.1 を決める 大会 とりあえず人のコードをパクって頑張る kaggle は沼( `・ω ・´) 27

Slide 28

Slide 28 text

参考資料 Kaggle - Wikipedia What is Kaggle, Why I Participate, What is the Impact? fast.ai · Making neural nets uncool again deeplearning.ai: Announcing new Deep Learning courses on Coursera 28

Slide 29

Slide 29 text

おわり( `・ω ・´) ようこそkaggle 沼へ 29

Slide 30

Slide 30 text

最後にいちおう We're hiring! 30