Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Mercari Machine Learning / NLP

Mercari Machine Learning / NLP

63f1f9fb5bdacf4b768cdf42cd38c12b?s=128

Tairo Moriyama

June 01, 2017
Tweet

More Decks by Tairo Moriyama

Other Decks in Technology

Transcript

  1. Mercari Machine Learning / NLP 30th of May 2017 Tairo

    Moriyama | Search Project Owner
  2. 2 まずお伝えしたい事

  3. 3 【衝撃】 数ヶ月前まで、ほとんど 機械学習やってなかった

  4. 4 【現在】 人材が集まってきて 一気にプロジェクトが 進んでいる

  5. 5 つい先程の発表で

  6. 再掲:場合によってはMLも使うよ • 知見発見のための機械学習 ◦ ルールの発見 ◦ ユーザの分類 • ルールベースでのユーザリストの作成 ◦

    ワンショット(実験的)な施策のターゲットとか • プロダクトに反映される機械学習 ⬅ コレ ◦ これは別に専用のチームがいる ◦ このあと話してくれます
  7. 7 Machine Learningのプロダクト適用 集客 1 検索 2 再訪 3

  8. 改善テーマ① 8 集客の自動最適化

  9. 外部のプラットフォームと商品データを連携 9 外部のProduct Ad Network Google App Script ・リアルタイムに広告出稿 ・売れたら商品は取り下げ

  10. 外部のプラットフォームと商品データを連携 10 とはいえ何でもかんでも 広告出しちゃうと無駄 クリックも増えるよね

  11. 外部のプラットフォームと商品データを連携 11 売れやすい商品を出したい

  12. 外部のプラットフォームと商品データを連携 12 外部のProduct Ad Network Google App Script ・一定期間内での売却確率を推定する ・売却確率が一定範囲の商品を広告出稿

    売却確率の推定
  13. 改善テーマ② 13 検索精度の向上

  14. 14 検索サジェスト改善

  15. 検索サジェストを「カテゴリ付き」にしたり 15

  16. 16 検索アルゴリズム改善

  17. 検索アルゴリズム改善事例「macbook」 17 CTR : 4.5倍↑

  18. いま取り組んでいること 18 キーワードに応じて最適な アルゴリズムを自動選定する

  19. 改善テーマ③ 19 再訪率の向上

  20. 20 レコメンド=広義の検索

  21. [US] 性別ごとにタイムラインを出し分ける 21 男性 女性 タップデータから 性別を予測する

  22. ユーザーのタップデータでクラスタリングしてみた 22

  23. ユーザーの興味を推定する(クラスタリング) 23 男の子の子供がい るパパママかな ・・・

  24. 24 その他にも未来に向けて 様々な実験が進行中

  25. 写真を撮影するだけの出品に向けて • ICCV, CVPR等の有名学会や、ILSVRC, Kaggle等のコンペティションで提案されている アルゴリズムを基にした技術開発 • 画像認識 ◦ カテゴリ認識、ブランド認識、商品状態認識

    ◦ Deep Neural Network (CNN) • 物体検出 / 画像セグメンテーション ◦ 衣類の複数出品や、同時撮影された付属部品等の分離 ◦ 前景物体抽出と色認識 ◦ (Fast/Faster) RCNN / SSD / DeepMask / SharpMask • 類似商品画像検索 ◦ 数億〜数十億の商品画像検索に耐えうる ▪ ベクトル表現 ▪ 次元圧縮 ▪ データ構造 ◦ 過去の取引情報から ▪ 商品タイトル、商品説明の生成 • RNN / LSTMといった自然言語処理の技術も必要 ▪ 販売価格推定 • 需要のトレンドも考慮した回帰モデル ▪ 配送運賃推定、発送方法推薦 • 画像計測ではなく、過去の取引実績に基づく推定 画像系では豊富なデータを活かした、Supervised Learning領域に注力
  26. 画像からのブランド推定(US Women’s HandBag) 26

  27. 画像からのブランド推定(US Women’s HandBag) 27

  28. 画像からのブランド推定(US Women’s HandBag) 28

  29. 29 機械学習インフラの話

  30. JP本番環境 US本番環境 Mercari-API Mercari-API lb lb endpoint : hogehoge3 endpoint

    : hogehoge1 endpoint : hogehoge2 ML webapi admin s3と定期的or更新時 にsyncする仕組み 全社的なMachine Learning基盤の開発 サーバー名:full_burnean ←コレ
  31. 31 つまり何が 言いたいかというと

  32. サーバーにガンダムの名前を つけると生産性が上がって しまうようなエンジニアの方 一緒に働きませんか ※メルカリ受付に飾ってあるデンドロビウム

  33. 33 Thank you! フリートークタイムでお話しましょう! Tairo Moriyama : サーチエンジニア / PM

    : 自然言語処理、機械学習 Takuma Yamaguchi : 機械学習エンジニア : 画像処理 Hiroaki Kudo : 機械学習エンジニア : 自然言語処理,強化学習 Yu Kodama : 機械学習エンジニア : 推薦システム