Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
初めての機械学習PJを やってみて得た知見
Search
yaginuuun
November 05, 2019
Technology
4.7k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
初めての機械学習PJを やってみて得た知見
Connehito Marché vol.6 〜機械学習・データ分析市〜 / 2019-11-05
にて発表
yaginuuun
November 05, 2019
More Decks by yaginuuun
See All by yaginuuun
メルカリホーム画面におけるレコメンド改善事例 - Long-tailを考慮した辞書拡張
shyaginuma
3
1.7k
メルカリにおけるA/Bテストワークフローの改善 これまでとこれから
shyaginuma
2
2k
メルカリにおけるA/Bテスト標準化への取り組み
shyaginuma
20
14k
A/BテストにおけるVariance reduction
shyaginuma
1
2.9k
過去コンペベースの学習をやってみたら意外と良かった話
shyaginuma
0
800
Kaggleもくもく会イントロ
shyaginuma
0
260
1on1 SQL Introduction at Globis
shyaginuma
1
1.4k
SlackへのKPI通知Botを作ったら いろいろ捗った話
shyaginuma
1
2.4k
BigQueryMLハンズオン勉強会
shyaginuma
3
1k
Other Decks in Technology
See All in Technology
AI-DLCを活用した高品質・安全なAI駆動開発実践 / AI Driven Development with AI-DLC
yoshidashingo
0
140
TypeScript Compiler APIとPHP-Parserを活用し、TypeScriptとPHPで型を共有する
shuta13
0
360
PHP と TypeScript の型システム比較:AI 時代の「型」は誰のためにあるのか? #frontend_phpcon_do / frontend_phpcon_do_2026
shogogg
1
250
React、まだ楽しくて草
uhyo
7
4.1k
Platform engineering for developers, architects & the rest of us (AI agents)
danielbryantuk
0
180
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
460
【Gen-AX】20260530開催_JJUG CCC 2026 Spring
genax
0
420
Terraformモジュールは、なぜ「魔境」化するのか
hayama17
1
190
Sony_KMP_Journey_KotlinConf2026
sony
2
210
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
180
AIガバナンス実践 - 生成AIコネクタのデータ漏洩リスクと実務対策
knishioka
0
190
形式手法特論:公平性制約の位相的特徴づけ #kernelvm / Kernel VM Study Kansai 12th
ytaka23
1
750
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.5k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
550
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.3k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
The agentic SEO stack - context over prompts
schlessera
0
790
Tell your own story through comics
letsgokoyo
1
940
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.5k
WCS-LA-2024
lcolladotor
0
620
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.3k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
380
Believing is Seeing
oripsolob
1
140
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
Transcript
初めての機械学習PJを やってみて得た知見 Connehito Marché vol.6 〜機械学習・データ分析市〜 グロービス 柳沼慎哉 / 2019-11-05
自己紹介 • データサイエンティスト@グロービス ◦ DW保守運用 ◦ ダッシュボード構築 ◦ プロダクト分析 ◦
レコメンド開発 ⬅ Now • 2018新卒(もうすぐ三年目!!) • kaggleもくもく会@麹町 運営してます twitter: @yaginuuun
会社紹介 • 国内最大規模の経営大学院、ビジネススクールを運営 • 最近e-learningへ進出(グロービス学び放題) ◦ 時間、場所の制約なく学べるサービスの提供 • 他にも色々やってます ◦
ベンチャーキャピタルによる投資 ◦ 書籍の出版 ◦ G1サミット(経営者会議)の運営
何をやったか グロービス知見録という自社メディアに学び放題への導線が存在
どうやったのか 従来の仕組み:タグ一致 • 知見録と学び放題でタグが一致したコンテンツを表示 • タグ運用が手動(たまに漏れが発生) 改良後:コンテンツ同士の類似度 • 知見録と学び放題で類似度の高いコンテンツを表示 •
タグに寄らず、関連コンテンツを表示できる(漏れが発生しない)
結果
結果
得た知見
• リーン的な考え方に近い(Minimum Viable Product) • 改善のポテンシャルが見える • 結果を見せながら議論できるので担当者間の連携がしやすくなる 知見① 簡単でも良いのでまず結果を見える形にする
• エムスリーの西場さんがおっしゃっていて、自分でやって改めて実感 ◦ 成功確率高い ◦ 工数少ない 知見② ルール→アルゴリズムへの置き換えは有効 エムスリーの機械学習チームビルディングの考え方 by
@m_nishiba / @Machine Learning Team Building Pitchより引用
• 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用 知見③ kaggleは役に立つ
• 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用 • こんな資料もあります:カグルとジツム 知見③ kaggleは役に立つ
まとめ • いろんな知見が得られた ◦ 超シンプルでも良いので一旦アウトプットを見える形にすると進みが良 い ◦ ルールベース → アルゴリズムベースへの置き換えは有効
◦ kaggleは役に立つ • 一方でやらなきゃいけないこともたくさん ◦ モデルの運用周り ◦ パイプライン設計、構築 ◦ 後々手を入れやすい設計、コーディング • 常にやっていき