Connehito Marché vol.6 〜機械学習・データ分析市〜 / 2019-11-05 にて発表
初めての機械学習PJを やってみて得た知見 Connehito Marché vol.6 〜機械学習・データ分析市〜 グロービス 柳沼慎哉 / 2019-11-05
View Slide
自己紹介 ● データサイエンティスト@グロービス ○ DW保守運用 ○ ダッシュボード構築 ○ プロダクト分析 ○ レコメンド開発 ⬅ Now ● 2018新卒(もうすぐ三年目!!) ● kaggleもくもく会@麹町 運営してます twitter: @yaginuuun
会社紹介 ● 国内最大規模の経営大学院、ビジネススクールを運営 ● 最近e-learningへ進出(グロービス学び放題) ○ 時間、場所の制約なく学べるサービスの提供 ● 他にも色々やってます ○ ベンチャーキャピタルによる投資 ○ 書籍の出版 ○ G1サミット(経営者会議)の運営
何をやったか グロービス知見録という自社メディアに学び放題への導線が存在
どうやったのか 従来の仕組み:タグ一致 ● 知見録と学び放題でタグが一致したコンテンツを表示 ● タグ運用が手動(たまに漏れが発生) 改良後:コンテンツ同士の類似度 ● 知見録と学び放題で類似度の高いコンテンツを表示 ● タグに寄らず、関連コンテンツを表示できる(漏れが発生しない)
結果
得た知見
● リーン的な考え方に近い(Minimum Viable Product) ● 改善のポテンシャルが見える ● 結果を見せながら議論できるので担当者間の連携がしやすくなる 知見① 簡単でも良いのでまず結果を見える形にする
● エムスリーの西場さんがおっしゃっていて、自分でやって改めて実感 ○ 成功確率高い ○ 工数少ない 知見② ルール→アルゴリズムへの置き換えは有効 エムスリーの機械学習チームビルディングの考え方 by @m_nishiba / @Machine Learning Team Building Pitchより引用
● 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを流用 知見③ kaggleは役に立つ
● 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを流用 ● こんな資料もあります:カグルとジツム 知見③ kaggleは役に立つ
まとめ ● いろんな知見が得られた ○ 超シンプルでも良いので一旦アウトプットを見える形にすると進みが良い ○ ルールベース → アルゴリズムベースへの置き換えは有効 ○ kaggleは役に立つ ● 一方でやらなきゃいけないこともたくさん ○ モデルの運用周り ○ パイプライン設計、構築 ○ 後々手を入れやすい設計、コーディング ● 常にやっていき