社内の勉強会で発表したoutput(一部抜粋版)2019.4.3 @nakamura244
View Slide
--色々省略
何個かある自分の学習課題の中で機械学習関連でアウトプットしようと思います
ちなみに私に数学的なbackboneなど皆無です
学習の題材簡単に言うと今Kaggleで頑張っています。kaggleとは?Kagglerの生態に詳しい人もはや別人種もはや競プロ?だいたいの初心者がやる 2つのコンペに参加している
学習のgoal- とりあえず、kaggleのエキスパートを獲得したい- エキスパート取れてからあとは考えるQ:数学的な知識が皆無に等しい状態で理解できるの?-> 僕たちがPHPのコードを書くのにその裏側にあるCの実装や使っているコンパイラやアセンブリ、バイナリの知識まで全てわかって使っている人は極わずか-> 最低限の振る舞いや考え方などを習得してオブジェクト指向の元にコーディングする事とだいたい一緒なのではないかと...-> MLをある程度適切に扱えるスキルを目指す。奥底のアルゴリズムまでをマスターするとかはその後
学習の題材kaggleを題材にしているわけ- より多くのユースケースがある- globalスタンダード- 適切なfeedbackや、ちゃんと評価される点新しく何かをやり始めたときに、適切にFeedBackしてくれてたり、適切な評価を与えてくれる事は学習にとってはとても重要
学習の過程- Discussionでmost votesの人のコメントをひたすら読む(全部英語)- KarnelsのBest Scoreの人のコードをひたすら読む&写経- そこにつくcommentもひたすら読む、理解する (全部英語)- ちょっと身近なデータで試してみる- リアリティのあるデータだと少しだけ楽しくなる- あとは本、kagglerの記事- わからない単語だらけで最初はツラかった
まとめ- 今回は教師なし学習のようなもの- 継続的に特徴量となり得そうなデータ収集はしないと改善ができない- PVとかクリックとかも- kaggleのコンペの方が全然むずい- 強調フィルタリング系は結構単純なアルゴリズムなのでsklearn使わずにJSだけで実現している人もいる様子- もちろんPHPでも全然書けると思う- いきなりレコメンドとしなくても、ターゲットメルマガ、ターゲットプッシュ通知とか活用どころはあると思う