Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
結局、Kagglerは 何を必死にやっているのか? 鈴木 天音 @SakuEji
Slide 2
Slide 2 text
自己紹介 鈴木天音(すずき あまね) ● Twitter: @SakuEji ● Kaggle Master(Kaggle歴2年弱) ● 最近ブログがプチバズするようになって嬉しい
Slide 3
Slide 3 text
「Kagglerと一緒になにかできるかも?」と思ってもらう このLTのゴール
Slide 4
Slide 4 text
Kaggleってなに?
Slide 5
Slide 5 text
Kaggleってなに? データ分析の世界大会です 学会 企業 世界中の データサイエンティストたち 出題 参加
Slide 6
Slide 6 text
何を競っているの? 与えられたお題を、どれだけ正確に予測できるかです 画像 + 名前 性別 年齢 説明 健康状態 動画の有無 ︙ どれだけ早く引き取り手が現れる?
Slide 7
Slide 7 text
予測精度でランキングが付きます
Slide 8
Slide 8 text
参加者はどれくらい? 問題の面白さと取り組み易さによって200人〜10000人くらいです Titanic 11000人 Home Credit 7200人 iMet 500人 Jigsaw 3000人 画像は人数少なめ (計算資源が必要) 自然言語処理は 数千人 テーブルデータはたくさん! < < <
Slide 9
Slide 9 text
上位にはメダルや賞金が与えられます 参加人数によりますが、だいたいのイメージはこれくらい トップ 3 トップ 10 上位 5 % 上位 10 %
Slide 10
Slide 10 text
何度も上位を取るとランクが上がります MasterとかGrandmasterとか言ってるのはこれ 本人確認 Novice 60000人 Contributor 50000人 Expert 4500人 Master 1200人 Grandmaster 150人 うち1枚はチームを組まず 取る必要あり! 「Kaggleやってます」がそのまま プラスに働くのはこのへんのイメージ
Slide 11
Slide 11 text
で、結局何が楽しいの? 個人的には2種類あると思っています 世界と戦って実力を磨く ネットゲーム的な楽しさ 普段扱ったことのないデータに触れ 知的好奇心をくすぐられる楽しさ
Slide 12
Slide 12 text
Kaggleの出題事例
Slide 13
Slide 13 text
クレジットカードの 貸し倒れ予測 (信用スコア)
Slide 14
Slide 14 text
天体の光り方から 現象を予測
Slide 15
Slide 15 text
美術品のタグ付け (文化・モチーフ)
Slide 16
Slide 16 text
犬の画像を生成
Slide 17
Slide 17 text
仕事にもいいことがあるよ! ● 幅広いタスクに対して素早く一定の成果を出せる ○ 日頃からいろいろなデータに触れているのでビビらない ○ 仮説検証のサイクルを高速で回すスキルが身についている ○ Kaggleで書いたコードを業務で再利用できる ● 解こうとしている課題が筋が良いか、なんとなく分かる ○ 「それはAIでもきついです><」 ○ 「こういう問題に落としたら解けるかも!」 ○ 「モデル改善するよりも他にやることあると思います」
Slide 18
Slide 18 text
Kagglerだからって得意とは限らないこと ● 作ったモデルを保守運用していくこと ○ Kaggleで鍛えられるのは探索的な分析+モデリングの部分 ○ 運用のスペシャリストと組んで動くのがスムーズ ○ もちろんKagglerの中でもこちらのスキルを伸ばしている人はいる ● きれいなコードを書くこと ○ Kaggleから入った人はチーム開発経験が少ないことも ○ Kaggleのコードをレビューする文化はあまりない
Slide 19
Slide 19 text
FAQ
Slide 20
Slide 20 text
Q. 予め必要な知識は? A. Pythonが読み書きできるとスムーズ その他は追々で大丈夫だと思います
Slide 21
Slide 21 text
Q. 超ハイスペックなPCがいるんじゃないの? A. ガチ勢はクラウド計算環境を借りてますが、 最初はみなさんの持ってるPCで大丈夫です
Slide 22
Slide 22 text
Q. Kaggleできるからって 実際の業務ができるとは限らないよね? A. データサイエンスのコアスキルのひとつを 担保してると思って欲しいです
Slide 23
Slide 23 text
おわりに
Slide 24
Slide 24 text
Kaggleやってみたいんだけど! 1. いますぐKaggleアカウントを作りましょう ○ https://www.kaggle.com/ 2. Slackコミュニティ kaggler-ja に入りましょう ○ 初心者質問用のチャンネル #beginners-help もあるので気軽にどうぞ! ○ http://kaggler-ja.herokuapp.com/
Slide 25
Slide 25 text
Kaggleじゃなくても、 Kagglerと一緒になにかやりましょう!