Slide 1

Slide 1 text

初めての機械学習PJを
 やってみて得た知見
 Connehito Marché vol.6 〜機械学習・データ分析市〜
 グロービス 柳沼慎哉 / 2019-11-05


Slide 2

Slide 2 text

自己紹介
 ● データサイエンティスト@グロービス
 ○ DW保守運用
 ○ ダッシュボード構築
 ○ プロダクト分析
 ○ レコメンド開発 ⬅ Now
 ● 2018新卒(もうすぐ三年目!!)
 ● kaggleもくもく会@麹町 運営してます
 twitter: @yaginuuun


Slide 3

Slide 3 text

会社紹介
 ● 国内最大規模の経営大学院、ビジネススクールを運営
 ● 最近e-learningへ進出(グロービス学び放題)
 ○ 時間、場所の制約なく学べるサービスの提供
 ● 他にも色々やってます
 ○ ベンチャーキャピタルによる投資
 ○ 書籍の出版
 ○ G1サミット(経営者会議)の運営


Slide 4

Slide 4 text

何をやったか
 グロービス知見録という自社メディアに学び放題への導線が存在


Slide 5

Slide 5 text

どうやったのか
 従来の仕組み:タグ一致
 ● 知見録と学び放題でタグが一致したコンテンツを表示
 ● タグ運用が手動(たまに漏れが発生)
 改良後:コンテンツ同士の類似度
 ● 知見録と学び放題で類似度の高いコンテンツを表示
 ● タグに寄らず、関連コンテンツを表示できる(漏れが発生しない)


Slide 6

Slide 6 text

結果


Slide 7

Slide 7 text

結果


Slide 8

Slide 8 text

得た知見


Slide 9

Slide 9 text

● リーン的な考え方に近い(Minimum Viable Product)
 ● 改善のポテンシャルが見える
 ● 結果を見せながら議論できるので担当者間の連携がしやすくなる
 知見① 簡単でも良いのでまず結果を見える形にする


Slide 10

Slide 10 text

● エムスリーの西場さんがおっしゃっていて、自分でやって改めて実感
 ○ 成功確率高い
 ○ 工数少ない
 知見② ルール→アルゴリズムへの置き換えは有効
 エムスリーの機械学習チームビルディングの考え方 by @m_nishiba / @Machine Learning Team Building Pitchより引用

Slide 11

Slide 11 text

● 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用
 知見③ kaggleは役に立つ
 


Slide 12

Slide 12 text

● 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用
 ● こんな資料もあります:カグルとジツム
 知見③ kaggleは役に立つ
 


Slide 13

Slide 13 text

まとめ
 ● いろんな知見が得られた
 ○ 超シンプルでも良いので一旦アウトプットを見える形にすると進みが良 い
 ○ ルールベース → アルゴリズムベースへの置き換えは有効
 ○ kaggleは役に立つ
 ● 一方でやらなきゃいけないこともたくさん
 ○ モデルの運用周り
 ○ パイプライン設計、構築
 ○ 後々手を入れやすい設計、コーディング
 ● 常にやっていき