Upgrade to Pro — share decks privately, control downloads, hide ads and more …

よわよわ大学生がKaggleの世界を覗いてみた話

063e54158177d322be871327c9567b5c?s=47 naa
July 09, 2020

 よわよわ大学生がKaggleの世界を覗いてみた話

【オンライン】 エンジニア志望学生LT大会 - TechStudyGroup #5
https://tech-study-group.connpass.com/event/180535/
での登壇資料です.

Kaggleを始めようと思ってる人が最初の第一歩を踏み出すのを応援する内容となってます.

063e54158177d322be871327c9567b5c?s=128

naa

July 09, 2020
Tweet

More Decks by naa

Other Decks in Programming

Transcript

  1. よわよわ大学生が Kaggleの世界を覗いてみた話 【オンライン】 エンジニア志望学生LT大会 - TechStudyGroup #5 2020/7/9 1

  2. Agenda • 自己紹介 • Kaggleとは • 初心者がつまるところ • 突破方法 •

    まとめ 2
  3. 自己紹介 • 名前:naa • 属性:大学4年生(院進予定23卒) • 好きなもの:パンケーキ • 苦手なもの:環境構築 •

    最近の趣味:あつ森、スプラ • データサイエンス・機械学習に興味あり Twitterアカウント @naa_yowayowa 3
  4. 近況 • 私事ですが、技育祭の学生LT大会で登壇しました。 • 技育祭:7/4,5に開催された、エンジニア学生のためのテックカンファレンス • LTテーマは「自慢したい無駄開発」 「世界中を敵に回してもあなたの味方bot」 • ひたすら自分を褒めてくれる自己肯定感爆上がりLINEbot

    • 完全にネタ… https://speakerdeck.com/naa/shi-jie-zhong-wodi-nihui-sitemoanatafalsewei-fang- bot-ji-yu-ji-xue-sheng-ltda-hui-deng-tan-zi-liao 4
  5. Kaggleとの出会い • 昨年、データサイエンティスト向けのサマーインターンで知った つよつよ大学院生 よわよわ私 最近Kaggleにはまってて^^ Kaggle…?? 5

  6. Kaggleとは 「The Home of Data Science & Machine Learning」 (データサイエンスと機械学習の家)

    By 公式 • 企業や政府などの組織とデータ分析のプロであるデータサイエンティスト /機械学習エンジニアを繋げるプラットフォーム • 「Competetion(コンペ)」がKaggleの目玉 Kaggleとは?機械学習初心者が知っておくべき3つの使い方 https://www.codexa.net/what-is-kaggle/ 6
  7. Kaggleとは Devsumi 2018summer https://www.slideshare.net/HaradaKei/devsumi-2018summer 7

  8. Kaggleのメリット • コーディング • データハンドリング • 数学、統計 • 機械学習の理論 •

    データを扱う「勘」 Kaggleで学べること ≒ データサイエンティストに必要なスキル 8
  9. Kaggleとの出会い あまりよく分かってないけど、 機械学習に興味あるし とりあえず登録してみよう!! よわよわ私 つよつよ大学院生 Kaggleやってみると力がつくよ~ ぜひやってみて!! 9

  10. いざ、登録! 新規登録 10

  11. いざ、登録! Googleアカウント or メールアドレス で簡単に作れる 11

  12. 登録完了! 12

  13. ...で、 どうしたらええねん!!! 13

  14. 初心者がつまるところ(私が詰まったところ) • 英語だらけでまずウッとなる • どこから始めればいいのか分からない • そもそも何をすればいいのかわからない よわよわ私 え、、、無理やん、、、 14

  15. 公式チュートリアル • 公式チュートリアルは一応ある • メールでタイタニックのコンペに 招待される 15

  16. タイタニックのコンペ • タイタニック号の乗客のうち誰が生き延びたかを予測するコンペ • 期限のない「入門用コンペ」 16

  17. 公式チュートリアル 17

  18. 公式チュートリアル 結局英語ばっかりで頭に入ってこない… 18

  19. 初心者がどうするべきか • 英語を勉強する 「Kaggle 初心者」でググる! • たくさんの初心者向け記事を出てくる よわよわ私 困ってるのは 私だけじゃないのね…!

    19
  20. 初心者向けに書いた記事を参考にする <特に参考にした記事> • Kaggleに登録したら次にやること ~ これだけやれば十分闘える!Titanicの先へ行く入門 10 Kernel ~ https://qiita.com/upura/items/3c10ff6fed4e7c3d70f0

    • Kaggleとは?機械学習初心者が知っておくべき3つの使い方 https://www.codexa.net/what-is-kaggle/ • 完全初学者がKaggleの「入門」を高速で終えるためのおすすめ資料などまとめ https://note.com/currypurin/n/nba054c13d0c0 20 Kaggleマスターのu++さんの記事
  21. ざっくりとした流れ • まず提出の仕方を知る • Notebook(Kernel)で学ぶ! • 機械学習の勉強をしてコンペに参加! 21

  22. Notebook(Kernel)とは • Kaggleに用意されている、ブラウザ上の実行環境 • もともとKernelという名前だった • Kernelと呼んでる記事は多い • 各データセットに対して他のユーザーが構築した予測モデルのコードや説 明が公開されている

    • 初心者にも優しく説明がされているものも多数あり • Copy and Editができる 22
  23. そもそも提出の仕方 • この記事の最初の項目が 「1. まずはsubmit! 順位表に載って みよう」 基礎中の基礎である、 Notebookの提出の仕方がわかる! 23

  24. Copy and Edit https://www.kaggle.com/sishihara/upura-kaggle-tutorial-01-first- submission • このNotebookをCopy and Editして、簡単にNotebook作成&提出 24

  25. あっさり提出 • Save VersionでCommitを選択 • Outputに予測結果のファイルが できる! • そしてSubmit 25

  26. 提出すると • スコアが表示され、順位表に自分の名前が載る! 26 たったこれだけ!提出の仕方はマスター!

  27. 提出の仕方がわかったら… • 提出の仕方さえわかれば、次にすることはNotebookを読み込んでいく • 初心者にも優しく説明がされているNotebookが多数あるので勉強になる • 「このコンペのデータでは、XXXXの事前処理をデータセットに加えて、〇〇のモデ ルを使って予測したら、XXの精度が出たよ。これがコードだよ」 • ある程度分かってきたら、コンペにチャレンジ!!

    よわよわ私 あ、意外と私でもできそうかも 27
  28. この本がおすすめらしい 28

  29. まとめ • 初心者でもググればKaggleを難なく始められる • ググる力大事 • つよつよの方の記事ありがたい • つよつよの方はどんどん記事書いてください •

    自分も慣れてきたら記事書きたいな • 機械学習の勉強頑張ろう • 英語の勉強頑張ろう 29