Upgrade to Pro — share decks privately, control downloads, hide ads and more …

本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle

yukinagae
September 28, 2018

本当に簡単なkaggleの始め方 / Easy Way to Start Kaggle

kaggleを0から説明 + やってみた(2クリック)

yukinagae

September 28, 2018
Tweet

More Decks by yukinagae

Other Decks in Technology

Transcript

  1. 本当に簡単なkaggle
    の始め方
    @yukinagae

    View full-size slide

  2. Agenda
    1. kaggle
    とは?
    2.
    データ分析のトレンドの変化
    3. kaggle
    の仕組み
    4.
    なぜkaggle
    をやるの?
    5.
    やってみた(
    `・ω
    ・´)
    2

    View full-size slide

  3. 1. kaggle
    とは?
    3

    View full-size slide

  4. 世界最大の機械学習・データ分析の
    コンペを主催するプラットフォーム
    4

    View full-size slide

  5. データサイエンティストの
    世界最強を決める大会
    6

    View full-size slide

  6. kaggle
    の規模
    ユーザ数: 50
    万以上
    国: 190
    カ国以上
    らしい(
    `・ω
    ・´)
    7

    View full-size slide

  7. 2.
    データ分析トレンドの変化
    8

    View full-size slide

  8. 理論(theory


    実践(practice

    9

    View full-size slide


  9. 理解するのが大事(theory



    実践・役立つのが大事(practice

    10

    View full-size slide

  10. 実践を重視している具体例
    kaggle
    コンペ
    ノウハウの共有(コード・ディスカッション)
    データの共有・公開
    fast.ai
    deep learning for coders
    (開発者の深層学習)
    理論より実践、SOA
    (state of art:
    最先端)
    11

    View full-size slide

  11. From: deeplearning.ai: Announcing new Deep
    Learning courses on Coursera 12

    View full-size slide

  12. AI
    社会による生活の向上
    by Andrew Ng (AI
    や機械学習の有名な教授・教師)
    I hope we can build an AI-powered society that
    gives everyone affordable healthcare, provides
    every child a personalized education, makes
    inexpensive self-driving cars available to all, and
    provides meaningful work for every man and
    woman. An AI-powered society that improves
    every person’s life.


    13

    View full-size slide

  13. 3. kaggle
    の仕組み
    14

    View full-size slide

  14. 大まかな流れ
    1.
    主催者(企業など)がコンペを主催する
    a.
    データを準備
    b.
    問題を定義する
    2.
    参加者は様々な手法を使ってベストなモデルを構
    築し、予測を提出する
    スコアやランキングが分かる
    3.
    主催者は、精度が高い予測に賞金を払う
    15

    View full-size slide

  15. 4. kaggle
    をなんでやるの?
    16

    View full-size slide

  16. 参加者のメリット
    様々なデータに触れられる(企業が実データを提
    供してくれる。レアい)
    他の参加者から学べる
    入賞すれば賞金 +
    良い仕事をGET

    楽しい
    ギャンブル感覚
    17

    View full-size slide

  17. 主催者側のメリット
    世界中のデータサイエンティストが問題解決の手
    法を試行錯誤してくれる
    ブランディング・PR
    データサイエンティストの採用
    18

    View full-size slide

  18. が、しかし
    19

    View full-size slide

  19. kaggle
    依存の副作用
    (kaggle is drug

    20

    View full-size slide

  20. コンペが始まると仕事しなく
    なる人たち
    21

    View full-size slide

  21. ということで
    22

    View full-size slide

  22. 5.
    早速kaggle
    をやってみた
    (
    `・ω
    ・´)
    23

    View full-size slide

  23. 1.
    コンペを選ぶ
    24

    View full-size slide

  24. 最近始まったばかりのコンペ(
    `・ω
    ・´)
    25

    View full-size slide

  25. 2.
    コンペの内容を読む
    1.
    概要:
    大まかに把握
    2.
    評価指標:
    これが一番大事(
    `・ω
    ・´)
    3.
    賞金:
    できればほしいよね
    4.
    期限:
    時間厳守
    5.
    データ:
    だいたいCSV
    ファイル(BigQuery
    も)
    26

    View full-size slide

  26. 3.
    他の参加者から学ぶ
    1.
    コード(kernel

    2.
    ディスカッション(discussion

    27

    View full-size slide

  27. いろんな人がコードを載せてくれてるので助かる
    see: Simple Exploration+Baseline - GA Customer
    Revenue | Kaggle
    28

    View full-size slide

  28. 4.
    他の参加者の方法を真似てみる
    コードをパクってローカルPC
    で実行するだけの簡単
    なお仕事(
    `・ω
    ・´)
    29

    View full-size slide

  29. 5.
    助け合う <= New!
    ちょうどライブラリのバージョンで上手く動作しなか
    ったので、上手くいった方法を教え合う(
    `・ω
    ・´)
    30

    View full-size slide

  30. 6.
    めんどくさいので人のコードを
    fork
    する
    31

    View full-size slide

  31. fork
    したコードを実行するだけ(
    `・ω
    ・´)
    32

    View full-size slide

  32. 7.
    予測を提出する
    34

    View full-size slide

  33. 8.
    スコアとランクを確認
    689
    位(全1,031
    チーム)
    ちーん(
    `・ω
    ・´)
    35

    View full-size slide

  34. 結局言いたいのは
    36

    View full-size slide

  35. パクった後が勝負
    37

    View full-size slide

  36. まとめ
    kaggle
    はデータサイエンティストのNo.1
    を決める
    大会
    理論より実践のトレンド
    とりあえず人のコードをパクって頑張る
    kaggle
    は沼(
    `・ω
    ・´)
    38

    View full-size slide

  37. 参考資料
    Kaggle - Wikipedia
    What is Kaggle, Why I Participate, What is the
    Impact?
    fast.ai · Making neural nets uncool again
    deeplearning.ai: Announcing new Deep Learning
    courses on Coursera
    39

    View full-size slide

  38. おわり(
    `・ω
    ・´)
    ようこそkaggle
    沼へ
    40

    View full-size slide