Upgrade to Pro — share decks privately, control downloads, hide ads and more …

本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle

yukinagae
September 28, 2018

本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle

kaggleを0から説明 + やってみた(2クリック)

yukinagae

September 28, 2018
Tweet

More Decks by yukinagae

Other Decks in Technology

Transcript

  1. 本当に簡単なkaggle
    の始め方
    @yukinagae

    View Slide

  2. Agenda
    1. kaggle
    とは?
    2.
    データ分析のトレンドの変化
    3. kaggle
    の仕組み
    4.
    なぜkaggle
    をやるの?
    5.
    やってみた(
    `・ω
    ・´)
    2

    View Slide

  3. 1. kaggle
    とは?
    3

    View Slide

  4. 世界最大の機械学習・データ分析の
    コンペを主催するプラットフォーム
    4

    View Slide

  5. つまり
    5

    View Slide

  6. データサイエンティストの
    世界最強を決める大会
    6

    View Slide

  7. kaggle
    の規模
    ユーザ数: 50
    万以上
    国: 190
    カ国以上
    らしい(
    `・ω
    ・´)
    7

    View Slide

  8. 2.
    データ分析トレンドの変化
    8

    View Slide

  9. 理論(theory


    実践(practice

    9

    View Slide


  10. 理解するのが大事(theory



    実践・役立つのが大事(practice

    10

    View Slide

  11. 実践を重視している具体例
    kaggle
    コンペ
    ノウハウの共有(コード・ディスカッション)
    データの共有・公開
    fast.ai
    deep learning for coders
    (開発者の深層学習)
    理論より実践、SOA
    (state of art:
    最先端)
    11

    View Slide

  12. From: deeplearning.ai: Announcing new Deep
    Learning courses on Coursera 12

    View Slide

  13. AI
    社会による生活の向上
    by Andrew Ng (AI
    や機械学習の有名な教授・教師)
    I hope we can build an AI-powered society that
    gives everyone affordable healthcare, provides
    every child a personalized education, makes
    inexpensive self-driving cars available to all, and
    provides meaningful work for every man and
    woman. An AI-powered society that improves
    every person’s life.


    13

    View Slide

  14. 3. kaggle
    の仕組み
    14

    View Slide

  15. 大まかな流れ
    1.
    主催者(企業など)がコンペを主催する
    a.
    データを準備
    b.
    問題を定義する
    2.
    参加者は様々な手法を使ってベストなモデルを構
    築し、予測を提出する
    スコアやランキングが分かる
    3.
    主催者は、精度が高い予測に賞金を払う
    15

    View Slide

  16. 4. kaggle
    をなんでやるの?
    16

    View Slide

  17. 参加者のメリット
    様々なデータに触れられる(企業が実データを提
    供してくれる。レアい)
    他の参加者から学べる
    入賞すれば賞金 +
    良い仕事をGET

    楽しい
    ギャンブル感覚
    17

    View Slide

  18. 主催者側のメリット
    世界中のデータサイエンティストが問題解決の手
    法を試行錯誤してくれる
    ブランディング・PR
    データサイエンティストの採用
    18

    View Slide

  19. が、しかし
    19

    View Slide

  20. kaggle
    依存の副作用
    (kaggle is drug

    20

    View Slide

  21. コンペが始まると仕事しなく
    なる人たち
    21

    View Slide

  22. ということで
    22

    View Slide

  23. 5.
    早速kaggle
    をやってみた
    (
    `・ω
    ・´)
    23

    View Slide

  24. 1.
    コンペを選ぶ
    24

    View Slide

  25. 最近始まったばかりのコンペ(
    `・ω
    ・´)
    25

    View Slide

  26. 2.
    コンペの内容を読む
    1.
    概要:
    大まかに把握
    2.
    評価指標:
    これが一番大事(
    `・ω
    ・´)
    3.
    賞金:
    できればほしいよね
    4.
    期限:
    時間厳守
    5.
    データ:
    だいたいCSV
    ファイル(BigQuery
    も)
    26

    View Slide

  27. 3.
    他の参加者から学ぶ
    1.
    コード(kernel

    2.
    ディスカッション(discussion

    27

    View Slide

  28. いろんな人がコードを載せてくれてるので助かる
    see: Simple Exploration+Baseline - GA Customer
    Revenue | Kaggle
    28

    View Slide

  29. 4.
    他の参加者の方法を真似てみる
    コードをパクってローカルPC
    で実行するだけの簡単
    なお仕事(
    `・ω
    ・´)
    29

    View Slide

  30. 5.
    助け合う <= New!
    ちょうどライブラリのバージョンで上手く動作しなか
    ったので、上手くいった方法を教え合う(
    `・ω
    ・´)
    30

    View Slide

  31. 6.
    めんどくさいので人のコードを
    fork
    する
    31

    View Slide

  32. fork
    したコードを実行するだけ(
    `・ω
    ・´)
    32

    View Slide

  33. 実行中
    33

    View Slide

  34. 7.
    予測を提出する
    34

    View Slide

  35. 8.
    スコアとランクを確認
    689
    位(全1,031
    チーム)
    ちーん(
    `・ω
    ・´)
    35

    View Slide

  36. 結局言いたいのは
    36

    View Slide

  37. パクった後が勝負
    37

    View Slide

  38. まとめ
    kaggle
    はデータサイエンティストのNo.1
    を決める
    大会
    理論より実践のトレンド
    とりあえず人のコードをパクって頑張る
    kaggle
    は沼(
    `・ω
    ・´)
    38

    View Slide

  39. 参考資料
    Kaggle - Wikipedia
    What is Kaggle, Why I Participate, What is the
    Impact?
    fast.ai · Making neural nets uncool again
    deeplearning.ai: Announcing new Deep Learning
    courses on Coursera
    39

    View Slide

  40. おわり(
    `・ω
    ・´)
    ようこそkaggle
    沼へ
    40

    View Slide