Slide 1

Slide 1 text

社内の勉強会で発表した output(一部抜粋版) 2019.4.3 @nakamura244

Slide 2

Slide 2 text

-- 色々省略

Slide 3

Slide 3 text

何個かある自分の学習課題の中で 機械学習関連でアウトプットしようと思いま す

Slide 4

Slide 4 text

ちなみに私に数学的なbackboneなど皆無 です

Slide 5

Slide 5 text

学習の題材 簡単に言うと今Kaggleで頑張っています。 kaggleとは? Kagglerの生態に詳しい人 もはや別人種 もはや競プロ? だいたいの初心者がやる 2つ のコンペに参加している

Slide 6

Slide 6 text

学習のgoal - とりあえず、kaggleのエキスパートを獲得したい - エキスパート取れてからあとは考える Q:数学的な知識が皆無に等しい状態で理解できるの? -> 僕たちがPHPのコードを書くのにその裏側にあるCの実装や使っているコンパイラや アセンブリ、バイナリの知識まで全てわかって使っている人は極わずか -> 最低限の振る舞いや考え方などを習得してオブジェクト指向の元にコーディングする 事とだいたい一緒なのではないかと... -> MLをある程度適切に扱えるスキルを目指す。奥底のアルゴリズムまでをマスターす るとかはその後

Slide 7

Slide 7 text

学習の題材 kaggleを題材にしているわけ - より多くのユースケースがある - globalスタンダード - 適切なfeedbackや、ちゃんと評価される点 新しく何かをやり始めたときに、適切にFeedBackしてくれてたり、適切な評価を与えてく れる事は学習にとってはとても重要

Slide 8

Slide 8 text

学習の過程 - Discussionでmost votesの人のコメントをひたすら読む(全部英語) - KarnelsのBest Scoreの人のコードをひたすら読む&写経 - そこにつくcommentもひたすら読む、理解する (全部英語) - ちょっと身近なデータで試してみる - リアリティのあるデータだと少しだけ楽しくなる - あとは本、kagglerの記事 - わからない単語だらけで最初はツラかった

Slide 9

Slide 9 text

-- 色々省略

Slide 10

Slide 10 text

まとめ - 今回は教師なし学習のようなもの - 継続的に特徴量となり得そうなデータ収集はしないと改善ができない - PVとかクリックとかも - kaggleのコンペの方が全然むずい - 強調フィルタリング系は結構単純なアルゴリズムなのでsklearn使わずにJSだけで 実現している人もいる様子 - もちろんPHPでも全然書けると思う - いきなりレコメンドとしなくても、ターゲットメルマガ、ターゲットプッシュ通知とか活用 どころはあると思う