Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
初めての機械学習PJを やってみて得た知見
yaginuuun
November 05, 2019
Technology
2
3.7k
初めての機械学習PJを やってみて得た知見
Connehito Marché vol.6 〜機械学習・データ分析市〜 / 2019-11-05
にて発表
yaginuuun
November 05, 2019
Tweet
Share
More Decks by yaginuuun
See All by yaginuuun
メルカリにおけるA/Bテスト標準化への取り組み
shyaginuma
18
8.8k
A/BテストにおけるVariance reduction
shyaginuma
2
1.1k
過去コンペベースの学習をやってみたら意外と良かった話
shyaginuma
0
450
Kaggleもくもく会イントロ
shyaginuma
0
110
1on1 SQL Introduction at Globis
shyaginuma
1
1k
SlackへのKPI通知Botを作ったら いろいろ捗った話
shyaginuma
1
1.6k
BigQueryMLハンズオン勉強会
shyaginuma
3
540
Other Decks in Technology
See All in Technology
マルチテナントSaaSのカスタム要件に、 Auth0テナントを分割せず向き合う! / Multi tenant SaaS with Auth0
hiroga
0
120
Settlement simulation testing to ensure correct settlement processing
applepine1125
2
1.5k
20220731 如何跟隨開源技術保持你的職涯發展
pichuang
0
120
森林情報のオープンデータと QGISでの利用
kou_kita
0
330
開発環境のセキュリティおよびCI/CDパイプラインのセキュア化
rung
PRO
12
5.1k
質の良い”カイゼン”の為の質の良い「振り返り」
shirayanagiryuji
0
130
サイバー攻撃を想定したクラウドネイティブセキュリティガイドラインとCNAPP及びSecurity Observabilityの未来
sakon310
4
470
Power BI のうらがわ
hanaseleb
1
160
You're M̶u̶t̶e̶d̶ Rooted
patrickwardle
1
7.7k
第22回 MLOps 勉強会:みてねのMLOps事情
tonouchi510
1
1.1k
Dangerous attack paths: Modern Development Environment Security - Devices and CI/CD pipelines
rung
PRO
0
170
増田亨さんによる 「設計の考え方とやり方」勉強会オープニング
tsuyok
0
220
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
16
8.5k
Building an army of robots
kneath
299
40k
Building Flexible Design Systems
yeseniaperezcruz
310
34k
StorybookのUI Testing Handbookを読んだ
zakiyama
6
2.5k
Bootstrapping a Software Product
garrettdimon
296
110k
The Language of Interfaces
destraynor
148
21k
The Invisible Customer
myddelton
110
11k
Designing Experiences People Love
moore
130
22k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_i
25
15k
Stop Working from a Prison Cell
hatefulcrawdad
262
17k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
237
19k
Design by the Numbers
sachag
271
17k
Transcript
初めての機械学習PJを やってみて得た知見 Connehito Marché vol.6 〜機械学習・データ分析市〜 グロービス 柳沼慎哉 / 2019-11-05
自己紹介 • データサイエンティスト@グロービス ◦ DW保守運用 ◦ ダッシュボード構築 ◦ プロダクト分析 ◦
レコメンド開発 ⬅ Now • 2018新卒(もうすぐ三年目!!) • kaggleもくもく会@麹町 運営してます twitter: @yaginuuun
会社紹介 • 国内最大規模の経営大学院、ビジネススクールを運営 • 最近e-learningへ進出(グロービス学び放題) ◦ 時間、場所の制約なく学べるサービスの提供 • 他にも色々やってます ◦
ベンチャーキャピタルによる投資 ◦ 書籍の出版 ◦ G1サミット(経営者会議)の運営
何をやったか グロービス知見録という自社メディアに学び放題への導線が存在
どうやったのか 従来の仕組み:タグ一致 • 知見録と学び放題でタグが一致したコンテンツを表示 • タグ運用が手動(たまに漏れが発生) 改良後:コンテンツ同士の類似度 • 知見録と学び放題で類似度の高いコンテンツを表示 •
タグに寄らず、関連コンテンツを表示できる(漏れが発生しない)
結果
結果
得た知見
• リーン的な考え方に近い(Minimum Viable Product) • 改善のポテンシャルが見える • 結果を見せながら議論できるので担当者間の連携がしやすくなる 知見① 簡単でも良いのでまず結果を見える形にする
• エムスリーの西場さんがおっしゃっていて、自分でやって改めて実感 ◦ 成功確率高い ◦ 工数少ない 知見② ルール→アルゴリズムへの置き換えは有効 エムスリーの機械学習チームビルディングの考え方 by
@m_nishiba / @Machine Learning Team Building Pitchより引用
• 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用 知見③ kaggleは役に立つ
• 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用 • こんな資料もあります:カグルとジツム 知見③ kaggleは役に立つ
まとめ • いろんな知見が得られた ◦ 超シンプルでも良いので一旦アウトプットを見える形にすると進みが良 い ◦ ルールベース → アルゴリズムベースへの置き換えは有効
◦ kaggleは役に立つ • 一方でやらなきゃいけないこともたくさん ◦ モデルの運用周り ◦ パイプライン設計、構築 ◦ 後々手を入れやすい設計、コーディング • 常にやっていき