Upgrade to Pro — share decks privately, control downloads, hide ads and more …

社内の勉強会で発表した_output_一部抜粋版_.pdf

 社内の勉強会で発表した_output_一部抜粋版_.pdf

tsuyoshi nakamura

April 09, 2019
Tweet

More Decks by tsuyoshi nakamura

Other Decks in Technology

Transcript

  1. 社内の勉強会で発表した
    output(一部抜粋版)
    2019.4.3 @nakamura244

    View Slide

  2. --
    色々省略

    View Slide

  3. 何個かある自分の学習課題の中で
    機械学習関連でアウトプットしようと思いま

    View Slide

  4. ちなみに私に数学的なbackboneなど皆無
    です

    View Slide

  5. 学習の題材
    簡単に言うと今Kaggleで頑張っています。
    kaggleとは?
    Kagglerの生態に詳しい人
    もはや別人種
    もはや競プロ?
    だいたいの初心者がやる 2つ
    のコンペに参加している

    View Slide

  6. 学習のgoal
    - とりあえず、kaggleのエキスパートを獲得したい
    - エキスパート取れてからあとは考える
    Q:数学的な知識が皆無に等しい状態で理解できるの?
    -> 僕たちがPHPのコードを書くのにその裏側にあるCの実装や使っているコンパイラや
    アセンブリ、バイナリの知識まで全てわかって使っている人は極わずか
    -> 最低限の振る舞いや考え方などを習得してオブジェクト指向の元にコーディングする
    事とだいたい一緒なのではないかと...
    -> MLをある程度適切に扱えるスキルを目指す。奥底のアルゴリズムまでをマスターす
    るとかはその後

    View Slide

  7. 学習の題材
    kaggleを題材にしているわけ
    - より多くのユースケースがある
    - globalスタンダード
    - 適切なfeedbackや、ちゃんと評価される点
    新しく何かをやり始めたときに、適切にFeedBackしてくれてたり、適切な評価を与えてく
    れる事は学習にとってはとても重要

    View Slide

  8. 学習の過程
    - Discussionでmost votesの人のコメントをひたすら読む(全部英語)
    - KarnelsのBest Scoreの人のコードをひたすら読む&写経
    - そこにつくcommentもひたすら読む、理解する (全部英語)
    - ちょっと身近なデータで試してみる
    - リアリティのあるデータだと少しだけ楽しくなる
    - あとは本、kagglerの記事
    - わからない単語だらけで最初はツラかった

    View Slide

  9. --
    色々省略

    View Slide

  10. まとめ
    - 今回は教師なし学習のようなもの
    - 継続的に特徴量となり得そうなデータ収集はしないと改善ができない
    - PVとかクリックとかも
    - kaggleのコンペの方が全然むずい
    - 強調フィルタリング系は結構単純なアルゴリズムなのでsklearn使わずにJSだけで
    実現している人もいる様子
    - もちろんPHPでも全然書けると思う
    - いきなりレコメンドとしなくても、ターゲットメルマガ、ターゲットプッシュ通知とか活用
    どころはあると思う

    View Slide