Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習によるマーケット健全化 Mercari ML Ops Night #1
Search
Ryusuke Chiba
May 24, 2018
Technology
3
5.5k
機械学習によるマーケット健全化 Mercari ML Ops Night #1
Ryusuke Chiba
May 24, 2018
Tweet
Share
More Decks by Ryusuke Chiba
See All by Ryusuke Chiba
10Xの検索を10xしたい at 第49回Elasticsearch勉強会
metalunk
0
520
10Xの検索を10xしたい at 【10X/M3/CADDi】検索エンジン運用勉強会
metalunk
5
1.4k
プログラマのための線形代数 おまけ
metalunk
1
150
メルカリにおける AI 活用事例 PyCon JP 2018
metalunk
8
6.9k
メルカリの機械学習基盤 これまでとこれから ML Ops Study #2
metalunk
0
880
Other Decks in Technology
See All in Technology
大「個人開発サービス」時代に僕たちはどう生きるか
sotarok
7
2k
Nstockの一人目エンジニアが 3年間かけて向き合ってきた セキュリティのこととこれから〜あれから半年〜
yo41sawada
0
180
なぜSaaSがMCPサーバーをサービス提供するのか?
sansantech
PRO
5
1.4k
進捗
ydah
2
230
実践アプリケーション設計 ②トランザクションスクリプトへの対応
recruitengineers
PRO
4
1.2k
絶対に失敗できないキャンペーンページの高速かつ安全な開発、WINTICKET × microCMS の開発事例
microcms
0
360
LLM翻訳ツールの開発と海外のお客様対応等への社内導入事例
gree_tech
PRO
0
430
退屈なことはDevinにやらせよう〜〜Devin APIを使ったVisual Regression Testの自動追加〜
kawamataryo
4
1.1k
kubellが考える戦略と実行を繋ぐ活用ファーストのデータ分析基盤
kubell_hr
0
120
Figma + Storybook + PlaywrightのMCPを使ったフロントエンド開発
yug1224
10
3.6k
役割は変わっても、変わらないもの 〜スクラムマスターからEMへの転身で学んだ信頼構築の本質〜 / How to build trust
shinop
0
150
PRDの正しい使い方 ~AI時代にも効く思考・対話・成長ツールとして~
techtekt
PRO
0
320
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Making the Leap to Tech Lead
cromwellryan
134
9.5k
The World Runs on Bad Software
bkeepers
PRO
70
11k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
139
34k
Code Reviewing Like a Champion
maltzj
525
40k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
Thoughts on Productivity
jonyablonski
69
4.8k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
11
1.1k
Imperfection Machines: The Place of Print at Facebook
scottboms
268
13k
Fireside Chat
paigeccino
39
3.6k
Docker and Python
trallard
45
3.5k
Music & Morning Musume
bryan
46
6.8k
Transcript
機械学習によるマーケット健全化 Ryusuke Chiba @metalunk Mercari ML Ops Night #1
筑波大学 (学部) 筑波大学 (院) メルカリ グリー 2013 2015 2017 自己紹介
• Ryusuke Chiba • https://twitter.com/metalunk
自己紹介 • 2013年 新卒 • GREE News の開発 • 消滅都市の開発
• 大学院受験をして受かったので退職 筑波大学 (学部) 筑波大学 (院) メルカリ グリー 2013 2015 2017
自己紹介 • FAQ「なんで会社やめて大学院行ったんですか?」 ◦ 筑波大学 (学部) 筑波大学 (院) メルカリ グリー
2013 2015 2017
自己紹介 • FAQ「なんで会社やめて大学院行ったんですか?」 ◦ 筑波大学 (学部) 筑波大学 (院) メルカリ グリー
2013 2015 2017 ggrks!! Google is Your Friend!!
自己紹介 • 数理最適化の研究 ◦ Derivative-free optimization (Nelder-Mead とか) ◦ 単体上における非凸関数の大域的最適化
筑波大学 (学部) 筑波大学 (院) メルカリ グリー 2013 2015 2017
自己紹介 • 2回目の新卒(中古の新卒) • Search チーム (2017.04 - 2017.12) ◦
クエリパラメータ最適化の仕組み (JP) ◦ 近所検索 (US) • 数学部 部長 ◦ 線形代数ゼミ,アルゴリズムゼミ,数理最適化ゼミ... 筑波大学 (学部) 筑波大学 (院) メルカリ グリー 2013 2015 2017
自己紹介 • CRE (Customer Reliability Engineering) と SysML ◦ 2018.01
から ◦ これから話す • 量子アニーリング ◦ D-wave のインターフェイスは数理最適化 筑波大学 (学部) 筑波大学 (院) メルカリ グリー 2013 2015 2017
自己紹介 先日 Andrew Ng 先生の Coursera Machine Learning を卒業しました ですのでむずかしい機械学習についての質問は...
機械学習による商品監視
メルカリについて • ダウンロード数: 世界合計1億800万ダウンロード超 (日本7,100万、米国 3,750万、英国数百万) (2018/3末時点) • 流通額 (GMV):
日本 938億円 (2018/1-3月四半期累計) • 利用者数 (登録MAU): 1050万人 (2018/3時点) ◦ 登録MAU (Monthly Active User) は1ヶ月に一度以上利用したユーザの数 (「メルカリ アッ テ」「メルカリカウル」「メルカリメゾンズ」「メルチャリ」「teacha」は含まず) • 社員数: 連結 約1000人,メルカリ単体650人 (2018/3末時点)
メルカリについて • カスタマーサポート(CS) ◦ お問い合わせへの対応や,違反出品物の取り締まりなど ◦ 仙台,福岡にも拠点がある • CRE (Customer
Reliability Engineering) ◦ 技術を駆使して,お客さまに安心して利用してもらえるサービス にしたい ▪ CS のオペレーション効率化
商品監視 安心安全なマーケットプレイスを維持するために,出品が禁止されているもの https://www.mercari.com/jp/help_center/getting_started/prohibited_items • 偽ブランド品 • 盗難品 • 18禁、アダルト、児童ポルノ関連 •
現金、金券類、カード類 • ゲームアカウントやゲーム内の通貨 • メルカリ事務局で不適切と判断されるもの • キーワード羅列 • etc...
商品監視 これまで 検索条件による検出 お客さまによる通報 機械学習による自動検知
商品監視 これまで 検索条件による検出 お客さまによる通報 機械学習による自動検知 CS によって管理(追加 & 削除)さ れていて,数百個もある
商品監視 これまで 検索条件による検出 お客さまによる通報 機械学習による自動検知 本当はお客さまの目に 触れる前に削除したい
商品監視 これまで 検索条件による検出 お客さまによる通報 機械学習による自動検知 さまざまな構成で動いている • 古い機械学習基盤とか • マイクロサービスとか
商品監視 いま Mercari API Machine Learning Platform publish subscribe あたらしい
ML 商品監視サービス Lovemachine!!
商品監視 いま あたらしい ML 商品監視サービス Lovemachine!! CsTool API Machine Learning
Platform Mercari API Worker publish subscribe hide/report report
商品監視 いま いくつかの既存モデルを,あたらしい ML Platform 上の商品監視サービス Lovemachine に移植中 それによって得られる恩恵は •
メルカリ API, CS Tool 側の共通処理 • コード品質の向上 • 再学習の仕組み • Blue-Green deploy • リソース管理 ML Platform Lovemachine
商品監視 いま 移植作業が大変だった • Train code がない • local でしか動かない状態の
Jupyter notebook • 身元不明の BigQuery table を読んでいる • 身元不明の CSV を読んでいる • DRY でない • 線形代数の効率的な演算が使えていない(for 文がある) • Evaluation を独立して実行できるようになっていない 恩恵: コード品質の向上
商品監視 いま 問題は • データサイエンティストとバックエンドエンジニアのスキルセットの差 • 分析時のコードがそのまま 恩恵: コード品質の向上 Lovemachine
に載せたかったら ある程度ちゃんとしないと載らない
商品監視 いま ML による 自動検知 CS メンバーの確認 (ラベルづけ) 教師データに CS
業務のフィードバックが得られる 恩恵: 再学習の仕組み
商品監視 いま データの傾向変化に対応できる たとえば • ゲームアカウント(新しいゲーム) • キーワード羅列(流行) 恩恵: 再学習の仕組み
機械学習基盤 これから
機械学習基盤 これから 1. 全ての移植作業をやるわけにはいかない 2. 機械学習基盤の機能を充実させたい • 社内 AutoML を作りたい?
i. Feature Extraction? ii. Black Box Optimization? 3. SysML がスキルセットの差を埋めたい • データサイエンティスト ⇔ SRE • データサイエンティスト ⇔ バックエンドエンジニア
We’re 超 hiring SysML https://open.talentio.com/1/c/mercari/requisitions/detail/7093