Slide 1

Slide 1 text

よわよわ大学生が Kaggleの世界を覗いてみた話 【オンライン】 エンジニア志望学生LT大会 - TechStudyGroup #5 2020/7/9 1

Slide 2

Slide 2 text

Agenda • 自己紹介 • Kaggleとは • 初心者がつまるところ • 突破方法 • まとめ 2

Slide 3

Slide 3 text

自己紹介 • 名前:naa • 属性:大学4年生(院進予定23卒) • 好きなもの:パンケーキ • 苦手なもの:環境構築 • 最近の趣味:あつ森、スプラ • データサイエンス・機械学習に興味あり Twitterアカウント @naa_yowayowa 3

Slide 4

Slide 4 text

近況 • 私事ですが、技育祭の学生LT大会で登壇しました。 • 技育祭:7/4,5に開催された、エンジニア学生のためのテックカンファレンス • LTテーマは「自慢したい無駄開発」 「世界中を敵に回してもあなたの味方bot」 • ひたすら自分を褒めてくれる自己肯定感爆上がりLINEbot • 完全にネタ… https://speakerdeck.com/naa/shi-jie-zhong-wodi-nihui-sitemoanatafalsewei-fang- bot-ji-yu-ji-xue-sheng-ltda-hui-deng-tan-zi-liao 4

Slide 5

Slide 5 text

Kaggleとの出会い • 昨年、データサイエンティスト向けのサマーインターンで知った つよつよ大学院生 よわよわ私 最近Kaggleにはまってて^^ Kaggle…?? 5

Slide 6

Slide 6 text

Kaggleとは 「The Home of Data Science & Machine Learning」 (データサイエンスと機械学習の家) By 公式 • 企業や政府などの組織とデータ分析のプロであるデータサイエンティスト /機械学習エンジニアを繋げるプラットフォーム • 「Competetion(コンペ)」がKaggleの目玉 Kaggleとは?機械学習初心者が知っておくべき3つの使い方 https://www.codexa.net/what-is-kaggle/ 6

Slide 7

Slide 7 text

Kaggleとは Devsumi 2018summer https://www.slideshare.net/HaradaKei/devsumi-2018summer 7

Slide 8

Slide 8 text

Kaggleのメリット • コーディング • データハンドリング • 数学、統計 • 機械学習の理論 • データを扱う「勘」 Kaggleで学べること ≒ データサイエンティストに必要なスキル 8

Slide 9

Slide 9 text

Kaggleとの出会い あまりよく分かってないけど、 機械学習に興味あるし とりあえず登録してみよう!! よわよわ私 つよつよ大学院生 Kaggleやってみると力がつくよ~ ぜひやってみて!! 9

Slide 10

Slide 10 text

いざ、登録! 新規登録 10

Slide 11

Slide 11 text

いざ、登録! Googleアカウント or メールアドレス で簡単に作れる 11

Slide 12

Slide 12 text

登録完了! 12

Slide 13

Slide 13 text

...で、 どうしたらええねん!!! 13

Slide 14

Slide 14 text

初心者がつまるところ(私が詰まったところ) • 英語だらけでまずウッとなる • どこから始めればいいのか分からない • そもそも何をすればいいのかわからない よわよわ私 え、、、無理やん、、、 14

Slide 15

Slide 15 text

公式チュートリアル • 公式チュートリアルは一応ある • メールでタイタニックのコンペに 招待される 15

Slide 16

Slide 16 text

タイタニックのコンペ • タイタニック号の乗客のうち誰が生き延びたかを予測するコンペ • 期限のない「入門用コンペ」 16

Slide 17

Slide 17 text

公式チュートリアル 17

Slide 18

Slide 18 text

公式チュートリアル 結局英語ばっかりで頭に入ってこない… 18

Slide 19

Slide 19 text

初心者がどうするべきか • 英語を勉強する 「Kaggle 初心者」でググる! • たくさんの初心者向け記事を出てくる よわよわ私 困ってるのは 私だけじゃないのね…! 19

Slide 20

Slide 20 text

初心者向けに書いた記事を参考にする <特に参考にした記事> • Kaggleに登録したら次にやること ~ これだけやれば十分闘える!Titanicの先へ行く入門 10 Kernel ~ https://qiita.com/upura/items/3c10ff6fed4e7c3d70f0 • Kaggleとは?機械学習初心者が知っておくべき3つの使い方 https://www.codexa.net/what-is-kaggle/ • 完全初学者がKaggleの「入門」を高速で終えるためのおすすめ資料などまとめ https://note.com/currypurin/n/nba054c13d0c0 20 Kaggleマスターのu++さんの記事

Slide 21

Slide 21 text

ざっくりとした流れ • まず提出の仕方を知る • Notebook(Kernel)で学ぶ! • 機械学習の勉強をしてコンペに参加! 21

Slide 22

Slide 22 text

Notebook(Kernel)とは • Kaggleに用意されている、ブラウザ上の実行環境 • もともとKernelという名前だった • Kernelと呼んでる記事は多い • 各データセットに対して他のユーザーが構築した予測モデルのコードや説 明が公開されている • 初心者にも優しく説明がされているものも多数あり • Copy and Editができる 22

Slide 23

Slide 23 text

そもそも提出の仕方 • この記事の最初の項目が 「1. まずはsubmit! 順位表に載って みよう」 基礎中の基礎である、 Notebookの提出の仕方がわかる! 23

Slide 24

Slide 24 text

Copy and Edit https://www.kaggle.com/sishihara/upura-kaggle-tutorial-01-first- submission • このNotebookをCopy and Editして、簡単にNotebook作成&提出 24

Slide 25

Slide 25 text

あっさり提出 • Save VersionでCommitを選択 • Outputに予測結果のファイルが できる! • そしてSubmit 25

Slide 26

Slide 26 text

提出すると • スコアが表示され、順位表に自分の名前が載る! 26 たったこれだけ!提出の仕方はマスター!

Slide 27

Slide 27 text

提出の仕方がわかったら… • 提出の仕方さえわかれば、次にすることはNotebookを読み込んでいく • 初心者にも優しく説明がされているNotebookが多数あるので勉強になる • 「このコンペのデータでは、XXXXの事前処理をデータセットに加えて、〇〇のモデ ルを使って予測したら、XXの精度が出たよ。これがコードだよ」 • ある程度分かってきたら、コンペにチャレンジ!! よわよわ私 あ、意外と私でもできそうかも 27

Slide 28

Slide 28 text

この本がおすすめらしい 28

Slide 29

Slide 29 text

まとめ • 初心者でもググればKaggleを難なく始められる • ググる力大事 • つよつよの方の記事ありがたい • つよつよの方はどんどん記事書いてください • 自分も慣れてきたら記事書きたいな • 機械学習の勉強頑張ろう • 英語の勉強頑張ろう 29