Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
初めての機械学習PJを やってみて得た知見
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
yaginuuun
November 05, 2019
Technology
2
4.6k
初めての機械学習PJを やってみて得た知見
Connehito Marché vol.6 〜機械学習・データ分析市〜 / 2019-11-05
にて発表
yaginuuun
November 05, 2019
Tweet
Share
More Decks by yaginuuun
See All by yaginuuun
メルカリホーム画面におけるレコメンド改善事例 - Long-tailを考慮した辞書拡張
shyaginuma
3
1.7k
メルカリにおけるA/Bテストワークフローの改善 これまでとこれから
shyaginuma
2
1.9k
メルカリにおけるA/Bテスト標準化への取り組み
shyaginuma
21
14k
A/BテストにおけるVariance reduction
shyaginuma
2
2.8k
過去コンペベースの学習をやってみたら意外と良かった話
shyaginuma
0
780
Kaggleもくもく会イントロ
shyaginuma
0
240
1on1 SQL Introduction at Globis
shyaginuma
1
1.4k
SlackへのKPI通知Botを作ったら いろいろ捗った話
shyaginuma
1
2.3k
BigQueryMLハンズオン勉強会
shyaginuma
3
970
Other Decks in Technology
See All in Technology
Bill One急成長の舞台裏 開発組織が直面した失敗と教訓
sansantech
PRO
2
410
旅先で iPad + Neovim で iOS 開発・執筆した話
zozotech
PRO
0
100
私たち準委任PdEは2つのプロダクトに挑戦する ~ソフトウェア、開発支援という”二重”のプロダクトエンジニアリングの実践~ / 20260212 Naoki Takahashi
shift_evolve
PRO
2
210
1,000 にも届く AWS Organizations 組織のポリシー運用をちゃんとしたい、という話
kazzpapa3
0
190
AIが実装する時代、人間は仕様と検証を設計する
gotalab555
1
640
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
270
生成AIと余白 〜開発スピードが向上した今、何に向き合う?〜
kakehashi
PRO
0
170
コスト削減から「セキュリティと利便性」を担うプラットフォームへ
sansantech
PRO
3
1.6k
GitHub Copilot CLI を使いやすくしよう
tsubakimoto_s
0
110
Agent Skils
dip_tech
PRO
0
140
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1.7k
Codex 5.3 と Opus 4.6 にコーポレートサイトを作らせてみた / Codex 5.3 vs Opus 4.6
ama_ch
0
220
Featured
See All Featured
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
61
52k
How to build a perfect <img>
jonoalderson
1
4.9k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.1k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.1k
How STYLIGHT went responsive
nonsquared
100
6k
Building an army of robots
kneath
306
46k
GraphQLの誤解/rethinking-graphql
sonatard
74
11k
Six Lessons from altMBA
skipperchong
29
4.2k
Marketing to machines
jonoalderson
1
4.7k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
400
Navigating Team Friction
lara
192
16k
Transcript
初めての機械学習PJを やってみて得た知見 Connehito Marché vol.6 〜機械学習・データ分析市〜 グロービス 柳沼慎哉 / 2019-11-05
自己紹介 • データサイエンティスト@グロービス ◦ DW保守運用 ◦ ダッシュボード構築 ◦ プロダクト分析 ◦
レコメンド開発 ⬅ Now • 2018新卒(もうすぐ三年目!!) • kaggleもくもく会@麹町 運営してます twitter: @yaginuuun
会社紹介 • 国内最大規模の経営大学院、ビジネススクールを運営 • 最近e-learningへ進出(グロービス学び放題) ◦ 時間、場所の制約なく学べるサービスの提供 • 他にも色々やってます ◦
ベンチャーキャピタルによる投資 ◦ 書籍の出版 ◦ G1サミット(経営者会議)の運営
何をやったか グロービス知見録という自社メディアに学び放題への導線が存在
どうやったのか 従来の仕組み:タグ一致 • 知見録と学び放題でタグが一致したコンテンツを表示 • タグ運用が手動(たまに漏れが発生) 改良後:コンテンツ同士の類似度 • 知見録と学び放題で類似度の高いコンテンツを表示 •
タグに寄らず、関連コンテンツを表示できる(漏れが発生しない)
結果
結果
得た知見
• リーン的な考え方に近い(Minimum Viable Product) • 改善のポテンシャルが見える • 結果を見せながら議論できるので担当者間の連携がしやすくなる 知見① 簡単でも良いのでまず結果を見える形にする
• エムスリーの西場さんがおっしゃっていて、自分でやって改めて実感 ◦ 成功確率高い ◦ 工数少ない 知見② ルール→アルゴリズムへの置き換えは有効 エムスリーの機械学習チームビルディングの考え方 by
@m_nishiba / @Machine Learning Team Building Pitchより引用
• 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用 知見③ kaggleは役に立つ
• 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用 • こんな資料もあります:カグルとジツム 知見③ kaggleは役に立つ
まとめ • いろんな知見が得られた ◦ 超シンプルでも良いので一旦アウトプットを見える形にすると進みが良 い ◦ ルールベース → アルゴリズムベースへの置き換えは有効
◦ kaggleは役に立つ • 一方でやらなきゃいけないこともたくさん ◦ モデルの運用周り ◦ パイプライン設計、構築 ◦ 後々手を入れやすい設計、コーディング • 常にやっていき