Slide 1

Slide 1 text

Mercari Machine Learning / NLP 30th of May 2017 Tairo Moriyama | Search Project Owner

Slide 2

Slide 2 text

2 まずお伝えしたい事

Slide 3

Slide 3 text

3 【衝撃】 数ヶ月前まで、ほとんど 機械学習やってなかった

Slide 4

Slide 4 text

4 【現在】 人材が集まってきて 一気にプロジェクトが 進んでいる

Slide 5

Slide 5 text

5 つい先程の発表で

Slide 6

Slide 6 text

再掲:場合によってはMLも使うよ ● 知見発見のための機械学習 ○ ルールの発見 ○ ユーザの分類 ● ルールベースでのユーザリストの作成 ○ ワンショット(実験的)な施策のターゲットとか ● プロダクトに反映される機械学習 ⬅ コレ ○ これは別に専用のチームがいる ○ このあと話してくれます

Slide 7

Slide 7 text

7 Machine Learningのプロダクト適用 集客 1 検索 2 再訪 3

Slide 8

Slide 8 text

改善テーマ① 8 集客の自動最適化

Slide 9

Slide 9 text

外部のプラットフォームと商品データを連携 9 外部のProduct Ad Network Google App Script ・リアルタイムに広告出稿 ・売れたら商品は取り下げ

Slide 10

Slide 10 text

外部のプラットフォームと商品データを連携 10 とはいえ何でもかんでも 広告出しちゃうと無駄 クリックも増えるよね

Slide 11

Slide 11 text

外部のプラットフォームと商品データを連携 11 売れやすい商品を出したい

Slide 12

Slide 12 text

外部のプラットフォームと商品データを連携 12 外部のProduct Ad Network Google App Script ・一定期間内での売却確率を推定する ・売却確率が一定範囲の商品を広告出稿 売却確率の推定

Slide 13

Slide 13 text

改善テーマ② 13 検索精度の向上

Slide 14

Slide 14 text

14 検索サジェスト改善

Slide 15

Slide 15 text

検索サジェストを「カテゴリ付き」にしたり 15

Slide 16

Slide 16 text

16 検索アルゴリズム改善

Slide 17

Slide 17 text

検索アルゴリズム改善事例「macbook」 17 CTR : 4.5倍↑

Slide 18

Slide 18 text

いま取り組んでいること 18 キーワードに応じて最適な アルゴリズムを自動選定する

Slide 19

Slide 19 text

改善テーマ③ 19 再訪率の向上

Slide 20

Slide 20 text

20 レコメンド=広義の検索

Slide 21

Slide 21 text

[US] 性別ごとにタイムラインを出し分ける 21 男性 女性 タップデータから 性別を予測する

Slide 22

Slide 22 text

ユーザーのタップデータでクラスタリングしてみた 22

Slide 23

Slide 23 text

ユーザーの興味を推定する(クラスタリング) 23 男の子の子供がい るパパママかな ・・・

Slide 24

Slide 24 text

24 その他にも未来に向けて 様々な実験が進行中

Slide 25

Slide 25 text

写真を撮影するだけの出品に向けて ● ICCV, CVPR等の有名学会や、ILSVRC, Kaggle等のコンペティションで提案されている アルゴリズムを基にした技術開発 ● 画像認識 ○ カテゴリ認識、ブランド認識、商品状態認識 ○ Deep Neural Network (CNN) ● 物体検出 / 画像セグメンテーション ○ 衣類の複数出品や、同時撮影された付属部品等の分離 ○ 前景物体抽出と色認識 ○ (Fast/Faster) RCNN / SSD / DeepMask / SharpMask ● 類似商品画像検索 ○ 数億〜数十億の商品画像検索に耐えうる ■ ベクトル表現 ■ 次元圧縮 ■ データ構造 ○ 過去の取引情報から ■ 商品タイトル、商品説明の生成 ● RNN / LSTMといった自然言語処理の技術も必要 ■ 販売価格推定 ● 需要のトレンドも考慮した回帰モデル ■ 配送運賃推定、発送方法推薦 ● 画像計測ではなく、過去の取引実績に基づく推定 画像系では豊富なデータを活かした、Supervised Learning領域に注力

Slide 26

Slide 26 text

画像からのブランド推定(US Women’s HandBag) 26

Slide 27

Slide 27 text

画像からのブランド推定(US Women’s HandBag) 27

Slide 28

Slide 28 text

画像からのブランド推定(US Women’s HandBag) 28

Slide 29

Slide 29 text

29 機械学習インフラの話

Slide 30

Slide 30 text

JP本番環境 US本番環境 Mercari-API Mercari-API lb lb endpoint : hogehoge3 endpoint : hogehoge1 endpoint : hogehoge2 ML webapi admin s3と定期的or更新時 にsyncする仕組み 全社的なMachine Learning基盤の開発 サーバー名:full_burnean ←コレ

Slide 31

Slide 31 text

31 つまり何が 言いたいかというと

Slide 32

Slide 32 text

サーバーにガンダムの名前を つけると生産性が上がって しまうようなエンジニアの方 一緒に働きませんか ※メルカリ受付に飾ってあるデンドロビウム

Slide 33

Slide 33 text

33 Thank you! フリートークタイムでお話しましょう! Tairo Moriyama : サーチエンジニア / PM : 自然言語処理、機械学習 Takuma Yamaguchi : 機械学習エンジニア : 画像処理 Hiroaki Kudo : 機械学習エンジニア : 自然言語処理,強化学習 Yu Kodama : 機械学習エンジニア : 推薦システム