Upgrade to Pro — share decks privately, control downloads, hide ads and more …

結局、Kagglerは何を必死にやっているのか? / What is Kaggle?

結局、Kagglerは何を必死にやっているのか? / What is Kaggle?

Kaggleのことをそもそも知らないという方に向けて、
・Kaggleとはそもそも何なのか?
・何が楽しいのか?
・どんな意味があるのか?
について話しました。

(非エンジニアも参加する社内LTで使った資料を、社内向けの項目を削除してアップロードしています)

70ae2d149767d4198aac83453481b8dd?s=128

Amane Suzuki

July 05, 2019
Tweet

Transcript

  1. 結局、Kagglerは 何を必死にやっているのか? 鈴木 天音 @SakuEji

  2. 自己紹介 鈴木天音(すずき あまね) • Twitter: @SakuEji • Kaggle Master(Kaggle歴2年弱) •

    最近ブログがプチバズするようになって嬉しい
  3. 「Kagglerと一緒になにかできるかも?」と思ってもらう このLTのゴール

  4. Kaggleってなに?

  5. Kaggleってなに? データ分析の世界大会です 学会 企業 世界中の データサイエンティストたち 出題 参加

  6. 何を競っているの? 与えられたお題を、どれだけ正確に予測できるかです 画像 + 名前 性別 年齢 説明 健康状態 動画の有無

    ︙ どれだけ早く引き取り手が現れる?
  7. 予測精度でランキングが付きます

  8. 参加者はどれくらい? 問題の面白さと取り組み易さによって200人〜10000人くらいです Titanic 11000人 Home Credit 7200人 iMet 500人 Jigsaw

    3000人 画像は人数少なめ (計算資源が必要) 自然言語処理は 数千人 テーブルデータはたくさん! < < <
  9. 上位にはメダルや賞金が与えられます 参加人数によりますが、だいたいのイメージはこれくらい トップ 3 トップ 10 上位 5 % 上位

    10 %
  10. 何度も上位を取るとランクが上がります MasterとかGrandmasterとか言ってるのはこれ 本人確認 Novice 60000人 Contributor 50000人 Expert 4500人 Master

    1200人 Grandmaster 150人 うち1枚はチームを組まず 取る必要あり! 「Kaggleやってます」がそのまま プラスに働くのはこのへんのイメージ
  11. で、結局何が楽しいの? 個人的には2種類あると思っています 世界と戦って実力を磨く ネットゲーム的な楽しさ 普段扱ったことのないデータに触れ 知的好奇心をくすぐられる楽しさ

  12. Kaggleの出題事例

  13. クレジットカードの 貸し倒れ予測 (信用スコア)

  14. 天体の光り方から 現象を予測

  15. 美術品のタグ付け (文化・モチーフ)

  16. 犬の画像を生成

  17. 仕事にもいいことがあるよ! • 幅広いタスクに対して素早く一定の成果を出せる ◦ 日頃からいろいろなデータに触れているのでビビらない ◦ 仮説検証のサイクルを高速で回すスキルが身についている ◦ Kaggleで書いたコードを業務で再利用できる •

    解こうとしている課題が筋が良いか、なんとなく分かる ◦ 「それはAIでもきついです><」 ◦ 「こういう問題に落としたら解けるかも!」 ◦ 「モデル改善するよりも他にやることあると思います」
  18. Kagglerだからって得意とは限らないこと • 作ったモデルを保守運用していくこと ◦ Kaggleで鍛えられるのは探索的な分析+モデリングの部分 ◦ 運用のスペシャリストと組んで動くのがスムーズ ◦ もちろんKagglerの中でもこちらのスキルを伸ばしている人はいる •

    きれいなコードを書くこと ◦ Kaggleから入った人はチーム開発経験が少ないことも ◦ Kaggleのコードをレビューする文化はあまりない
  19. FAQ

  20. Q. 予め必要な知識は? A. Pythonが読み書きできるとスムーズ その他は追々で大丈夫だと思います

  21. Q. 超ハイスペックなPCがいるんじゃないの? A. ガチ勢はクラウド計算環境を借りてますが、 最初はみなさんの持ってるPCで大丈夫です

  22. Q. Kaggleできるからって 実際の業務ができるとは限らないよね? A. データサイエンスのコアスキルのひとつを 担保してると思って欲しいです

  23. おわりに

  24. Kaggleやってみたいんだけど! 1. いますぐKaggleアカウントを作りましょう ◦ https://www.kaggle.com/ 2. Slackコミュニティ kaggler-ja に入りましょう ◦

    初心者質問用のチャンネル #beginners-help もあるので気軽にどうぞ! ◦ http://kaggler-ja.herokuapp.com/
  25. Kaggleじゃなくても、 Kagglerと一緒になにかやりましょう!