本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle - short ver.

79a92313bba008d66f30b226ee618fa7?s=47 yukinagae
February 19, 2019

本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle - short ver.

79a92313bba008d66f30b226ee618fa7?s=128

yukinagae

February 19, 2019
Tweet

Transcript

  1. 本当に簡単なkaggle の始め方 @yukinagae

  2. 自己紹介 永江悠紀 @yukinagae グロービス 2018/8 ~ データサイエンティスト(Python/Go) 経歴 元Java/Scala エンジニア

    オーストラリアでデータ分析を勉強 → 今に至る 最近はベイズ統計モデリングに興味ある(˘ω˘) スヤァ
  3. Agenda 1. kaggle とは? 2. kaggle の仕組み 3. やってみた( `・ω

    ・´) 3
  4. 1. kaggle とは? 4

  5. 世界最大の機械学習・データ分析の コンペを主催するプラットフォーム 5

  6. つまり 6

  7. データサイエンティストの 世界最強を決める大会 7

  8. kaggle の規模 ユーザ数: 50 万以上 国: 190 カ国以上 らしい( `・ω

    ・´) 8
  9. 2. kaggle の仕組み 9

  10. 大まかな流れ 1. 主催者(企業など)がコンペを主催する a. データを準備 b. 問題を定義する 2. 参加者は様々な手法を使ってベストなモデルを構 築し、予測を提出する

    スコアやランキングが分かる 3. 主催者は、精度が高い予測に賞金を払う 10
  11. ということで 11

  12. 3. 早速kaggle をやってみた ( `・ω ・´) 12

  13. 1. コンペを選ぶ 13

  14. 例えばこのコンペ( `・ω ・´) 14

  15. 2. コンペの内容を読む 1. 概要: 大まかに把握 2. 評価指標: これが一番大事( `・ω ・´)

    3. 賞金: できればほしいよね 4. 期限: 時間厳守 5. データ: だいたいCSV ファイル(BigQuery も) 15
  16. 3. 他の参加者から学ぶ 1. コード(kernel ) 2. ディスカッション(discussion ) 16

  17. いろんな人がコードを載せてくれてるので助かる see: Simple Exploration+Baseline - GA Customer Revenue | Kaggle

    17
  18. 4. 他の参加者の方法を真似てみる コードをパクってローカルPC で実行するだけの簡単 なお仕事( `・ω ・´) 18

  19. 5. 助け合う <= New! ちょうどライブラリのバージョンで上手く動作しなか ったので、上手くいった方法を教え合う( `・ω ・´) 19

  20. 6. めんどくさいので人のコードを fork する 20

  21. fork したコードを実行するだけ( `・ω ・´) 21

  22. 実行中 22

  23. 7. 予測を提出する 23

  24. 8. スコアとランクを確認 689 位(全1,031 チーム) ちーん( `・ω ・´) 24

  25. 結局言いたいのは 25

  26. パクった後が勝負 26

  27. まとめ kaggle はデータサイエンティストのNo.1 を決める 大会 とりあえず人のコードをパクって頑張る kaggle は沼( `・ω ・´)

    27
  28. 参考資料 Kaggle - Wikipedia What is Kaggle, Why I Participate,

    What is the Impact? fast.ai · Making neural nets uncool again deeplearning.ai: Announcing new Deep Learning courses on Coursera 28
  29. おわり( `・ω ・´) ようこそkaggle 沼へ 29

  30. 最後にいちおう We're hiring! 30