Slide 1

Slide 1 text

結局、Kagglerは 何を必死にやっているのか? 鈴木 天音 @SakuEji

Slide 2

Slide 2 text

自己紹介 鈴木天音(すずき あまね) ● Twitter: @SakuEji ● Kaggle Master(Kaggle歴2年弱) ● 最近ブログがプチバズするようになって嬉しい

Slide 3

Slide 3 text

「Kagglerと一緒になにかできるかも?」と思ってもらう このLTのゴール

Slide 4

Slide 4 text

Kaggleってなに?

Slide 5

Slide 5 text

Kaggleってなに? データ分析の世界大会です 学会 企業 世界中の データサイエンティストたち 出題 参加

Slide 6

Slide 6 text

何を競っているの? 与えられたお題を、どれだけ正確に予測できるかです 画像 + 名前 性別 年齢 説明 健康状態 動画の有無 ︙ どれだけ早く引き取り手が現れる?

Slide 7

Slide 7 text

予測精度でランキングが付きます

Slide 8

Slide 8 text

参加者はどれくらい? 問題の面白さと取り組み易さによって200人〜10000人くらいです Titanic 11000人 Home Credit 7200人 iMet 500人 Jigsaw 3000人 画像は人数少なめ (計算資源が必要) 自然言語処理は 数千人 テーブルデータはたくさん! < < <

Slide 9

Slide 9 text

上位にはメダルや賞金が与えられます 参加人数によりますが、だいたいのイメージはこれくらい トップ 3 トップ 10 上位 5 % 上位 10 %

Slide 10

Slide 10 text

何度も上位を取るとランクが上がります MasterとかGrandmasterとか言ってるのはこれ 本人確認 Novice 60000人 Contributor 50000人 Expert 4500人 Master 1200人 Grandmaster 150人 うち1枚はチームを組まず 取る必要あり! 「Kaggleやってます」がそのまま プラスに働くのはこのへんのイメージ

Slide 11

Slide 11 text

で、結局何が楽しいの? 個人的には2種類あると思っています 世界と戦って実力を磨く ネットゲーム的な楽しさ 普段扱ったことのないデータに触れ 知的好奇心をくすぐられる楽しさ

Slide 12

Slide 12 text

Kaggleの出題事例

Slide 13

Slide 13 text

クレジットカードの 貸し倒れ予測 (信用スコア)

Slide 14

Slide 14 text

天体の光り方から 現象を予測

Slide 15

Slide 15 text

美術品のタグ付け (文化・モチーフ)

Slide 16

Slide 16 text

犬の画像を生成

Slide 17

Slide 17 text

仕事にもいいことがあるよ! ● 幅広いタスクに対して素早く一定の成果を出せる ○ 日頃からいろいろなデータに触れているのでビビらない ○ 仮説検証のサイクルを高速で回すスキルが身についている ○ Kaggleで書いたコードを業務で再利用できる ● 解こうとしている課題が筋が良いか、なんとなく分かる ○ 「それはAIでもきついです><」 ○ 「こういう問題に落としたら解けるかも!」 ○ 「モデル改善するよりも他にやることあると思います」

Slide 18

Slide 18 text

Kagglerだからって得意とは限らないこと ● 作ったモデルを保守運用していくこと ○ Kaggleで鍛えられるのは探索的な分析+モデリングの部分 ○ 運用のスペシャリストと組んで動くのがスムーズ ○ もちろんKagglerの中でもこちらのスキルを伸ばしている人はいる ● きれいなコードを書くこと ○ Kaggleから入った人はチーム開発経験が少ないことも ○ Kaggleのコードをレビューする文化はあまりない

Slide 19

Slide 19 text

FAQ

Slide 20

Slide 20 text

Q. 予め必要な知識は? A. Pythonが読み書きできるとスムーズ その他は追々で大丈夫だと思います

Slide 21

Slide 21 text

Q. 超ハイスペックなPCがいるんじゃないの? A. ガチ勢はクラウド計算環境を借りてますが、 最初はみなさんの持ってるPCで大丈夫です

Slide 22

Slide 22 text

Q. Kaggleできるからって 実際の業務ができるとは限らないよね? A. データサイエンスのコアスキルのひとつを 担保してると思って欲しいです

Slide 23

Slide 23 text

おわりに

Slide 24

Slide 24 text

Kaggleやってみたいんだけど! 1. いますぐKaggleアカウントを作りましょう ○ https://www.kaggle.com/ 2. Slackコミュニティ kaggler-ja に入りましょう ○ 初心者質問用のチャンネル #beginners-help もあるので気軽にどうぞ! ○ http://kaggler-ja.herokuapp.com/

Slide 25

Slide 25 text

Kaggleじゃなくても、 Kagglerと一緒になにかやりましょう!