Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
Mercari Machine Learning / NLP
Tairo Moriyama
June 01, 2017
Technology
2
30k
Mercari Machine Learning / NLP
Tairo Moriyama
June 01, 2017
Tweet
Share
More Decks by Tairo Moriyama
See All by Tairo Moriyama
メルカリ商品検索のUI/UXと新たな挑戦
tairosan
33
12k
UI/UXが無意識に検索行動に与える影響について
tairosan
4
1k
Other Decks in Technology
See All in Technology
Deep Neural Networkの共同学習
hf149
0
330
AI Services 概要 / AI Services overview
oracle4engineer
PRO
0
170
JAWS-UG 横浜 #54 資料
takakuni
0
220
OCI DevOps 概要 / OCI DevOps overview
oracle4engineer
PRO
0
510
SPA・SSGでSSRのようなOGP対応!
simo123
2
160
OPENLOGI Company Profile
hr01
0
12k
Raspberry Pi Camera 3 介紹
piepie_tw
PRO
0
160
目指せCoverage100%! AutoScale環境におけるSavings Plans購入戦略 / JAWS-UG_SRE_Coverage
taishin
0
520
岐路に立つ若手がAmazonianの仕事術を学んできました / learning amazonian productivity hacks as a junior engineer
yayoi_dd
0
150
USB PD で迎える AC アダプター大統一時代
puhitaku
2
2k
OpenShiftクラスターのアップグレード自動化への挑戦! / OpenShift Cluster Upgrade Automation
skitamura7446
0
200
Deep dive in Reserved Instance ~脳死推奨量購入からの脱却~
kzkmaeda
0
550
Featured
See All Featured
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
120
29k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
270
12k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
10
1.3k
The World Runs on Bad Software
bkeepers
PRO
59
5.7k
Clear Off the Table
cherdarchuk
79
290k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
182
15k
Automating Front-end Workflow
addyosmani
1351
200k
A Philosophy of Restraint
colly
193
15k
Designing on Purpose - Digital PM Summit 2013
jponch
108
5.9k
How GitHub (no longer) Works
holman
298
140k
Music & Morning Musume
bryan
37
4.6k
Building a Modern Day E-commerce SEO Strategy
aleyda
6
4.5k
Transcript
Mercari Machine Learning / NLP 30th of May 2017 Tairo
Moriyama | Search Project Owner
2 まずお伝えしたい事
3 【衝撃】 数ヶ月前まで、ほとんど 機械学習やってなかった
4 【現在】 人材が集まってきて 一気にプロジェクトが 進んでいる
5 つい先程の発表で
再掲:場合によってはMLも使うよ • 知見発見のための機械学習 ◦ ルールの発見 ◦ ユーザの分類 • ルールベースでのユーザリストの作成 ◦
ワンショット(実験的)な施策のターゲットとか • プロダクトに反映される機械学習 ⬅ コレ ◦ これは別に専用のチームがいる ◦ このあと話してくれます
7 Machine Learningのプロダクト適用 集客 1 検索 2 再訪 3
改善テーマ① 8 集客の自動最適化
外部のプラットフォームと商品データを連携 9 外部のProduct Ad Network Google App Script ・リアルタイムに広告出稿 ・売れたら商品は取り下げ
外部のプラットフォームと商品データを連携 10 とはいえ何でもかんでも 広告出しちゃうと無駄 クリックも増えるよね
外部のプラットフォームと商品データを連携 11 売れやすい商品を出したい
外部のプラットフォームと商品データを連携 12 外部のProduct Ad Network Google App Script ・一定期間内での売却確率を推定する ・売却確率が一定範囲の商品を広告出稿
売却確率の推定
改善テーマ② 13 検索精度の向上
14 検索サジェスト改善
検索サジェストを「カテゴリ付き」にしたり 15
16 検索アルゴリズム改善
検索アルゴリズム改善事例「macbook」 17 CTR : 4.5倍↑
いま取り組んでいること 18 キーワードに応じて最適な アルゴリズムを自動選定する
改善テーマ③ 19 再訪率の向上
20 レコメンド=広義の検索
[US] 性別ごとにタイムラインを出し分ける 21 男性 女性 タップデータから 性別を予測する
ユーザーのタップデータでクラスタリングしてみた 22
ユーザーの興味を推定する(クラスタリング) 23 男の子の子供がい るパパママかな ・・・
24 その他にも未来に向けて 様々な実験が進行中
写真を撮影するだけの出品に向けて • ICCV, CVPR等の有名学会や、ILSVRC, Kaggle等のコンペティションで提案されている アルゴリズムを基にした技術開発 • 画像認識 ◦ カテゴリ認識、ブランド認識、商品状態認識
◦ Deep Neural Network (CNN) • 物体検出 / 画像セグメンテーション ◦ 衣類の複数出品や、同時撮影された付属部品等の分離 ◦ 前景物体抽出と色認識 ◦ (Fast/Faster) RCNN / SSD / DeepMask / SharpMask • 類似商品画像検索 ◦ 数億〜数十億の商品画像検索に耐えうる ▪ ベクトル表現 ▪ 次元圧縮 ▪ データ構造 ◦ 過去の取引情報から ▪ 商品タイトル、商品説明の生成 • RNN / LSTMといった自然言語処理の技術も必要 ▪ 販売価格推定 • 需要のトレンドも考慮した回帰モデル ▪ 配送運賃推定、発送方法推薦 • 画像計測ではなく、過去の取引実績に基づく推定 画像系では豊富なデータを活かした、Supervised Learning領域に注力
画像からのブランド推定(US Women’s HandBag) 26
画像からのブランド推定(US Women’s HandBag) 27
画像からのブランド推定(US Women’s HandBag) 28
29 機械学習インフラの話
JP本番環境 US本番環境 Mercari-API Mercari-API lb lb endpoint : hogehoge3 endpoint
: hogehoge1 endpoint : hogehoge2 ML webapi admin s3と定期的or更新時 にsyncする仕組み 全社的なMachine Learning基盤の開発 サーバー名:full_burnean ←コレ
31 つまり何が 言いたいかというと
サーバーにガンダムの名前を つけると生産性が上がって しまうようなエンジニアの方 一緒に働きませんか ※メルカリ受付に飾ってあるデンドロビウム
33 Thank you! フリートークタイムでお話しましょう! Tairo Moriyama : サーチエンジニア / PM
: 自然言語処理、機械学習 Takuma Yamaguchi : 機械学習エンジニア : 画像処理 Hiroaki Kudo : 機械学習エンジニア : 自然言語処理,強化学習 Yu Kodama : 機械学習エンジニア : 推薦システム