Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
メルカリにおける AI 活用事例 PyCon JP 2018
Search
Ryusuke Chiba
September 17, 2018
Technology
8
6.8k
メルカリにおける AI 活用事例 PyCon JP 2018
Ryusuke Chiba
September 17, 2018
Tweet
Share
More Decks by Ryusuke Chiba
See All by Ryusuke Chiba
10Xの検索を10xしたい at 第49回Elasticsearch勉強会
metalunk
0
490
10Xの検索を10xしたい at 【10X/M3/CADDi】検索エンジン運用勉強会
metalunk
5
1.3k
プログラマのための線形代数 おまけ
metalunk
1
150
メルカリの機械学習基盤 これまでとこれから ML Ops Study #2
metalunk
0
830
機械学習によるマーケット健全化 Mercari ML Ops Night #1
metalunk
3
5.4k
Other Decks in Technology
See All in Technology
Raycast AI APIを使ってちょっと便利な拡張機能を作ってみた / created-a-handy-extension-using-the-raycast-ai-api
kawamataryo
0
100
管理者しか知らないOutlookの裏側のAIを覗く#AzureTravelers
hirotomotaguchi
2
430
明日からできる!技術的負債の返済を加速するための実践ガイド~『ホットペッパービューティー』の事例をもとに~
recruitengineers
PRO
3
410
あれは良かった、あれは苦労したB2B2C型SaaSの新規開発におけるCloud Spanner
hirohito1108
2
610
リーダブルテストコード 〜メンテナンスしやすい テストコードを作成する方法を考える〜 #DevSumi #DevSumiB / Readable test code
nihonbuson
11
7.3k
データの品質が低いと何が困るのか
kzykmyzw
6
1.1k
RECRUIT TECH CONFERENCE 2025 プレイベント【高橋】
recruitengineers
PRO
0
160
エンジニアの育成を支える爆速フィードバック文化
sansantech
PRO
3
1.1k
AndroidXR 開発ツールごとの できることできないこと
donabe3
0
130
トラシューアニマルになろう ~開発者だからこそできる、安定したサービス作りの秘訣~
jacopen
2
2k
OpenID Connect for Identity Assurance の概要と翻訳版のご紹介 / 20250219-BizDay17-OIDC4IDA-Intro
oidfj
0
280
「海外登壇」という 選択肢を与えるために 〜Gophers EX
logica0419
0
710
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.6k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
9
440
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
174
51k
Building Your Own Lightsaber
phodgson
104
6.2k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
193
16k
Git: the NoSQL Database
bkeepers
PRO
427
64k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
133
33k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
Bash Introduction
62gerente
611
210k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
100
18k
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
Transcript
メルカリにおける AI 活用事例 PyCon JP 2018 Ryusuke Chiba @metalunk
発表タイトルについて弁明 申し込み時点で完成していなかったものを発表したかったので,もしもできなかったとき のために,曖昧なタイトルにしました... > メルカリにおける AI 活用事例 画像検索はだいたいできたので話せることになりました!
自己紹介 Ryusuke Chiba @metalunk • グリー ◦ GREE News ◦
消滅都市 • 数理最適化 • メルカリ ◦ 検索 ◦ 機械学習基盤 (SysML)
きょう話すこと メルカリで Python を使っている事例についてお話しします • メルカリにおける機械学習の活用事例ざっくり • 画像検索機能をつくった話 • 量子アニーリングインターンの話
メルカリでの Python いまのところメルカリでは Python を使っているのはほとんど Team-AI だけ(あとは Search チームくらい) しかし,マイクロサービス化が進んでおり,それぞれのサービスにぴったりな言語を自由
に選択できる!
メルカリにおける機械学習 Machine Learning Usage in Mercari
メルカリのご紹介 「メルカリ」は、個人がスマホで簡単に売り買いを楽しめる、CtoCマーケットプレイスです。
メルカリのご紹介 2013年7月に日本での提供を開始しました。 2014年9月にUS、2017年3月にはUKにおいてもサービスの提供を開始しています。 ※ 1.累計ダウンロード数は、各月末の累計数を記載しております。 2.累計ダウンロード数及び登録MAUには「メルカリ カウル」、「メルチャリ」は含んでおりません。 3.登録MAUは、「登録Monthly Active User」の略であり、「メルカリ」に登録
しているユーザーのうち、1ヶ月に一度以上「メルカリ」を利用したユーザーを集計しております。 4.登録MAUの四半期平均を記載しております。 5.流通総額は取引高の合計(「メルカリ カウル」を経由した購入を含む)を記載しており、四半期 毎の合計額となっております。為替レートについては、各月の期中の期中平均為替レートを使用しております。 累計ダウンロード数(1)(2) 百万件 1億件突破 20156月 期 20166月 期 20176月 期 20176月 期 登録MAU(2)(3)(4) 百万人 1,075万人 20156月 期 20166月 期 20176月 期 20176月 期 流通総額(5) 十億円 961億円 20156月 期 20166月 期 20176月 期 20176月 期
メルカリが保有するデータの種類
メルカリが保有するデータ規模
メルカリにおける機械学習の取り組み 「簡単」な売買 • 画像認識による商品タイトル、情報自動入力 (JP, US) • 商品の重さ推定 (US) •
商品の値段推定 (US) 「安全」な売買 • 類似画像検索 (JP) • マルチモーダルによる違法出品検知 (JP)
画像認識によるタイトル,カテゴリ,ブランド自動入力 簡単 !
機械学習基盤 Machine Learning Platform
チーム構成 Sculley, et al, “Hidden Technical Debt in Machine Learning
Systems”, NIPS 2015 https://papers.nips.cc/paper/5656-hidden-technical-debt-in-machine-learning-systems.pdf メルカリ Team-AI 機械学習エンジニア SysML
機械学習基盤 メルカリでは内製の機械学習基盤をつくっています 1. つくったモデルをかんたんにデプロイ a. 設定ファイルさえ書けば出せるように 2. モデルの管理 a. バージョン管理,デグレしない
3. Kubernetes a. Container による再現性 b. Resource management 4. Component の再利用 a. たとえばある分類器のために作られた Feature Extraction は他でも使える
構成
画像検索 Image Retrieval
モチベーション 画像をクエリにし,画像が似ている商品を探し出す まずは社内の Customer Support Tool に提供 • 違反出品を発見したときに,似ている商品を検索し一網打尽 •
商品についての何らかの判定モデルを作るときの教師データ収集 自分は基盤を作る役割
画像検索の仕組み - 全体像
画像検索の仕組み - Feature Extraction 画像をベクトルに変換する 今回は商品のカテゴリとブランドを当てられるようにトレーニングした Deep Neural Networks の中間層のベクトルを利用する
画像検索の仕組み - Faiss Faiss Facebook AI Research 製の類似検索 / クラスタリング用ライブラリ
C++ 製だが,Python wrapper をもつ Johnson et al, “Billion-scale similarity search with GPUs”, https://arxiv.org/pdf/1702.08734.pdf, 2017
画像検索の仕組み - 全体像
構成
構成
画像検索
量子アニーリング Quantum Annealing
急に量子...? https://tech.mercari.com/entry/professional_internship 量子アニーリングマシンである D-Wave を使ったインターンを実施しま した そして D-Wave は Python
API を提供 している!
量子アニーリングとは? 量子アニーリングマシンである D-Wave は QUBO (Quadratic Unconstrained Binaly Optimization Problem)
という形の最適化問題の近似解(精度保証はなし)を得られま す Media Resources https://www.dwavesys.com/resources/media-resources
かんたんな D-Wave の使い方 1. 好きな最適化問題を QUBO に変換し,パラメータ Q を得ます 2.
Python で D-Wave API を叩きます 3. カナダの D-Wave マシンに Q が送られ,量子効果により答え(最適解とは限らな い)が得られます 4. 変換の逆操作で,元の問題の解に戻します
かんたんな D-Wave の使い方 https://github.com/dwavesystems/qbsolv/blob/master/examples/tryDwaveQbsolv.py これは実際は CPU で解かれているシミュレータで,QPU を使いたい場合は D-Wave に発行された
token が必要になる
量子アニーリングインターン • yonesuke ◦ 「D-WaveマシンでGraph Golfに挑戦した話」 ◦ https://tech.mercari.com/entry/2018/09/11/171607 • @__ukun
◦ 「D-waveマシンで最大カット問題を解く」 ◦ https://tech.mercari.com/entry/2018/09/13/165921
まとめ Conclusion
まとめ メルカリの Python 利用事例について話しました • 機械学習の活用事例ざっくり • 機械学習基盤の説明 • 画像検索の説明
• 量子アニーリングの説明 メルカリブース出してます!