Upgrade to Pro — share decks privately, control downloads, hide ads and more …

結局、Kagglerは何を必死にやっているのか? / What is Kaggle?

結局、Kagglerは何を必死にやっているのか? / What is Kaggle?

Kaggleのことをそもそも知らないという方に向けて、
・Kaggleとはそもそも何なのか?
・何が楽しいのか?
・どんな意味があるのか?
について話しました。

(非エンジニアも参加する社内LTで使った資料を、社内向けの項目を削除してアップロードしています)

Amane Suzuki

July 05, 2019
Tweet

More Decks by Amane Suzuki

Other Decks in Programming

Transcript

  1. 結局、Kagglerは
    何を必死にやっているのか?
    鈴木 天音 @SakuEji

    View full-size slide

  2. 自己紹介
    鈴木天音(すずき あまね)
    ● Twitter: @SakuEji
    ● Kaggle Master(Kaggle歴2年弱)
    ● 最近ブログがプチバズするようになって嬉しい

    View full-size slide

  3. 「Kagglerと一緒になにかできるかも?」と思ってもらう
    このLTのゴール

    View full-size slide

  4. Kaggleってなに?

    View full-size slide

  5. Kaggleってなに?
    データ分析の世界大会です
    学会
    企業
    世界中の
    データサイエンティストたち
    出題
    参加

    View full-size slide

  6. 何を競っているの?
    与えられたお題を、どれだけ正確に予測できるかです
    画像

    名前
    性別
    年齢
    説明
    健康状態
    動画の有無

    どれだけ早く引き取り手が現れる?

    View full-size slide

  7. 予測精度でランキングが付きます

    View full-size slide

  8. 参加者はどれくらい?
    問題の面白さと取り組み易さによって200人〜10000人くらいです
    Titanic
    11000人
    Home Credit
    7200人
    iMet
    500人
    Jigsaw
    3000人
    画像は人数少なめ
    (計算資源が必要)
    自然言語処理は
    数千人
    テーブルデータはたくさん!
    < < <

    View full-size slide

  9. 上位にはメダルや賞金が与えられます
    参加人数によりますが、だいたいのイメージはこれくらい
    トップ 3
    トップ 10
    上位 5 %
    上位 10 %

    View full-size slide

  10. 何度も上位を取るとランクが上がります
    MasterとかGrandmasterとか言ってるのはこれ
    本人確認
    Novice
    60000人
    Contributor
    50000人
    Expert
    4500人
    Master
    1200人
    Grandmaster
    150人
    うち1枚はチームを組まず
    取る必要あり!
    「Kaggleやってます」がそのまま
    プラスに働くのはこのへんのイメージ

    View full-size slide

  11. で、結局何が楽しいの?
    個人的には2種類あると思っています
    世界と戦って実力を磨く
    ネットゲーム的な楽しさ
    普段扱ったことのないデータに触れ
    知的好奇心をくすぐられる楽しさ

    View full-size slide

  12. Kaggleの出題事例

    View full-size slide

  13. クレジットカードの
    貸し倒れ予測
    (信用スコア)

    View full-size slide

  14. 天体の光り方から
    現象を予測

    View full-size slide

  15. 美術品のタグ付け
    (文化・モチーフ)

    View full-size slide

  16. 犬の画像を生成

    View full-size slide

  17. 仕事にもいいことがあるよ!
    ● 幅広いタスクに対して素早く一定の成果を出せる
    ○ 日頃からいろいろなデータに触れているのでビビらない
    ○ 仮説検証のサイクルを高速で回すスキルが身についている
    ○ Kaggleで書いたコードを業務で再利用できる
    ● 解こうとしている課題が筋が良いか、なんとなく分かる
    ○ 「それはAIでもきついです><」
    ○ 「こういう問題に落としたら解けるかも!」
    ○ 「モデル改善するよりも他にやることあると思います」

    View full-size slide

  18. Kagglerだからって得意とは限らないこと
    ● 作ったモデルを保守運用していくこと
    ○ Kaggleで鍛えられるのは探索的な分析+モデリングの部分
    ○ 運用のスペシャリストと組んで動くのがスムーズ
    ○ もちろんKagglerの中でもこちらのスキルを伸ばしている人はいる
    ● きれいなコードを書くこと
    ○ Kaggleから入った人はチーム開発経験が少ないことも
    ○ Kaggleのコードをレビューする文化はあまりない

    View full-size slide

  19. Q.
    予め必要な知識は?
    A.
    Pythonが読み書きできるとスムーズ
    その他は追々で大丈夫だと思います

    View full-size slide

  20. Q.
    超ハイスペックなPCがいるんじゃないの?
    A.
    ガチ勢はクラウド計算環境を借りてますが、
    最初はみなさんの持ってるPCで大丈夫です

    View full-size slide

  21. Q.
    Kaggleできるからって
    実際の業務ができるとは限らないよね?
    A.
    データサイエンスのコアスキルのひとつを
    担保してると思って欲しいです

    View full-size slide

  22. おわりに

    View full-size slide

  23. Kaggleやってみたいんだけど!
    1. いますぐKaggleアカウントを作りましょう
    ○ https://www.kaggle.com/
    2. Slackコミュニティ kaggler-ja に入りましょう
    ○ 初心者質問用のチャンネル #beginners-help もあるので気軽にどうぞ!
    ○ http://kaggler-ja.herokuapp.com/

    View full-size slide

  24. Kaggleじゃなくても、
    Kagglerと一緒になにかやりましょう!

    View full-size slide