Upgrade to Pro — share decks privately, control downloads, hide ads and more …

結局、Kagglerは何を必死にやっているのか? / What is Kaggle?

結局、Kagglerは何を必死にやっているのか? / What is Kaggle?

Kaggleのことをそもそも知らないという方に向けて、
・Kaggleとはそもそも何なのか?
・何が楽しいのか?
・どんな意味があるのか?
について話しました。

(非エンジニアも参加する社内LTで使った資料を、社内向けの項目を削除してアップロードしています)

Amane Suzuki

July 05, 2019
Tweet

More Decks by Amane Suzuki

Other Decks in Programming

Transcript

  1. 結局、Kagglerは
    何を必死にやっているのか?
    鈴木 天音 @SakuEji

    View Slide

  2. 自己紹介
    鈴木天音(すずき あまね)
    ● Twitter: @SakuEji
    ● Kaggle Master(Kaggle歴2年弱)
    ● 最近ブログがプチバズするようになって嬉しい

    View Slide

  3. 「Kagglerと一緒になにかできるかも?」と思ってもらう
    このLTのゴール

    View Slide

  4. Kaggleってなに?

    View Slide

  5. Kaggleってなに?
    データ分析の世界大会です
    学会
    企業
    世界中の
    データサイエンティストたち
    出題
    参加

    View Slide

  6. 何を競っているの?
    与えられたお題を、どれだけ正確に予測できるかです
    画像

    名前
    性別
    年齢
    説明
    健康状態
    動画の有無

    どれだけ早く引き取り手が現れる?

    View Slide

  7. 予測精度でランキングが付きます

    View Slide

  8. 参加者はどれくらい?
    問題の面白さと取り組み易さによって200人〜10000人くらいです
    Titanic
    11000人
    Home Credit
    7200人
    iMet
    500人
    Jigsaw
    3000人
    画像は人数少なめ
    (計算資源が必要)
    自然言語処理は
    数千人
    テーブルデータはたくさん!
    < < <

    View Slide

  9. 上位にはメダルや賞金が与えられます
    参加人数によりますが、だいたいのイメージはこれくらい
    トップ 3
    トップ 10
    上位 5 %
    上位 10 %

    View Slide

  10. 何度も上位を取るとランクが上がります
    MasterとかGrandmasterとか言ってるのはこれ
    本人確認
    Novice
    60000人
    Contributor
    50000人
    Expert
    4500人
    Master
    1200人
    Grandmaster
    150人
    うち1枚はチームを組まず
    取る必要あり!
    「Kaggleやってます」がそのまま
    プラスに働くのはこのへんのイメージ

    View Slide

  11. で、結局何が楽しいの?
    個人的には2種類あると思っています
    世界と戦って実力を磨く
    ネットゲーム的な楽しさ
    普段扱ったことのないデータに触れ
    知的好奇心をくすぐられる楽しさ

    View Slide

  12. Kaggleの出題事例

    View Slide

  13. クレジットカードの
    貸し倒れ予測
    (信用スコア)

    View Slide

  14. 天体の光り方から
    現象を予測

    View Slide

  15. 美術品のタグ付け
    (文化・モチーフ)

    View Slide

  16. 犬の画像を生成

    View Slide

  17. 仕事にもいいことがあるよ!
    ● 幅広いタスクに対して素早く一定の成果を出せる
    ○ 日頃からいろいろなデータに触れているのでビビらない
    ○ 仮説検証のサイクルを高速で回すスキルが身についている
    ○ Kaggleで書いたコードを業務で再利用できる
    ● 解こうとしている課題が筋が良いか、なんとなく分かる
    ○ 「それはAIでもきついです><」
    ○ 「こういう問題に落としたら解けるかも!」
    ○ 「モデル改善するよりも他にやることあると思います」

    View Slide

  18. Kagglerだからって得意とは限らないこと
    ● 作ったモデルを保守運用していくこと
    ○ Kaggleで鍛えられるのは探索的な分析+モデリングの部分
    ○ 運用のスペシャリストと組んで動くのがスムーズ
    ○ もちろんKagglerの中でもこちらのスキルを伸ばしている人はいる
    ● きれいなコードを書くこと
    ○ Kaggleから入った人はチーム開発経験が少ないことも
    ○ Kaggleのコードをレビューする文化はあまりない

    View Slide

  19. FAQ

    View Slide

  20. Q.
    予め必要な知識は?
    A.
    Pythonが読み書きできるとスムーズ
    その他は追々で大丈夫だと思います

    View Slide

  21. Q.
    超ハイスペックなPCがいるんじゃないの?
    A.
    ガチ勢はクラウド計算環境を借りてますが、
    最初はみなさんの持ってるPCで大丈夫です

    View Slide

  22. Q.
    Kaggleできるからって
    実際の業務ができるとは限らないよね?
    A.
    データサイエンスのコアスキルのひとつを
    担保してると思って欲しいです

    View Slide

  23. おわりに

    View Slide

  24. Kaggleやってみたいんだけど!
    1. いますぐKaggleアカウントを作りましょう
    ○ https://www.kaggle.com/
    2. Slackコミュニティ kaggler-ja に入りましょう
    ○ 初心者質問用のチャンネル #beginners-help もあるので気軽にどうぞ!
    ○ http://kaggler-ja.herokuapp.com/

    View Slide

  25. Kaggleじゃなくても、
    Kagglerと一緒になにかやりましょう!

    View Slide