Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DMM.comにおけるレコメンドへのDeep Learningの活用

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.
Avatar for DMM.com DMM.com
August 07, 2017

DMM.comにおけるレコメンドへのDeep Learningの活用

Avatar for DMM.com

DMM.com

August 07, 2017
Tweet

More Decks by DMM.com

Other Decks in Technology

Transcript

  1. Copyright © since 2017 DMM All Rights Reserved. における レコメンドへの

    Deep Learning の活⽤ 中野 裕貴, 領家 ⾶⿃ DMM.comラボ ビッグデータ部 レコメンドチーム DMM.com Copyright © since 2017 DMM All Rights Reserved.
  2. Copyright © since 2017 DMM All Rights Reserved. 3 中野

    裕貴 Yuki Nakano 株式会社 DMM.comラボ ビッグデータ部 レコメンドチーム ⼤学院では服装のレコメンドを研究 →2016年4⽉1⽇からDMM.comラボ新卒⼊社
  3. Copyright © since 2017 DMM All Rights Reserved. 4 領家

    ⾶⿃ Asuka Ryoke 株式会社 DMM.comラボ ビッグデータ部 レコメンドチーム ⼤学院ではニューラルネットの進化的学習を研究 →2016年4⽉1⽇からDMM.comラボ新卒⼊社
  4. Copyright © since 2017 DMM All Rights Reserved. 6 DMM.comは1999年から続く

    ⽼舗サービスサイトです。 時代のニーズに合わせた多彩 なコンテンツを、17年間培った 独⾃プラットフォームで安定的 に提供しています。 About DMM.com サービスについて
  5. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 7 ビッグデータ部の仕事 DMMユーザのログ ビッグデータ 基盤 レコメンド基盤 検索基盤 メルマガ 収集・クレンジング レコメンドを提供 検索を提供
  6. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 8 これまでの活動 登壇 2015/02:Developers Summit Winter 2015: リアルタイムレコメンド(Spark) 2015/11:Cloudera World Tokyo 2015: Kafka 2016/02:Hadoop/Spark Conference Japan 2016: Hive on Spark 2016/11:Cloudera World Tokyo 2016: ディープラーニング プレスリリース 2015/09:“Sparkを活⽤したアジアパシフィック初のレコメンド基盤実現” 2017/05:“DMM.comラボとIDCフロンティア、コンテンツレコメンドの精度向上を共同検証”
  7. Copyright © since 2017 DMM All Rights Reserved. 10 DMM.com

    Deep Learning 使って何かしたい Deep Learningを⽤いた レコメンドとかは? Deep Learningを⽤いてコ ンテンツをパーソナライズ できないか? ⼿動で⾏っている作業を Deep Learningなどを 使って⾃動化したい
  8. Copyright © since 2017 DMM All Rights Reserved. 11 Deep

    Learning が社内で盛り上がってる ふわっと
  9. Copyright © since 2017 DMM All Rights Reserved. 12 Deep

    Learning で実現したいことを社内で投票してもらった
  10. Copyright © since 2017 DMM All Rights Reserved. 13 Deep

    Learning で実現したいことを社内で投票してもらった Deep Learning を使ってシーンの特徴を抽出 Deep Learning を使って不正検出・⾃動化
  11. Copyright © since 2017 DMM All Rights Reserved. 16 ⼿始めとして取り組んだ

    Deep Learningを活⽤したレコメンドの話 ...と⾔うより 『モデル作成までの道のりの話』
  12. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 18 画像 Deep Learning Deep Learningの活⽤ 特徴量
  13. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 19 Deep Learningの活⽤ Deep Learningの活⽤ 特徴量 レコメンド 画像 ⾃動タグ付け 利⽤ Deep Learning 動画, ⾳声 など 応⽤ 検索
  14. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 20 Deep Learningを活⽤したレコメンド 商品のパッケージ画像が類似した商品をレコメンド
  15. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 21 Deep Learningを活⽤したレコメンド 画像の特徴を使ってレコメンド …パッケージ買いのような効果を期待 商品のパッケージ画像が類似した商品をレコメンド
  16. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 22 画像特徴を算出するモデル モデル ⼊ ⼒ 出 ⼒ 商品画像 brown hair : 0.9 smile : 0.8 long hair : 0.8 特徴タグとスコア
  17. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 23 パッケージ画像レコメンドのアーキテクチャ IDCF クラウド
  18. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 26 Illustration2Vec Illustration2Vec : http://illustration2vec.net/ 様々なイラストを学習したモデル 画像から特徴 (タグ)とスコアを取得可能 Illustlatio n2vec brown hair : 0.9 smile : 0.8 long hair : 0.8 特徴タグとスコア
  19. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 28 ⾃作モデルの作成 Illustration2Vec で得られない特徴も算出したい Deep Learning Illustlatio n2vec ⾃作 モデル cute : 0.9 brown hair : 0.9 smile : 0.8 long hair : 0.8 young : 0.6 特徴タグとスコア
  20. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 29 ⾃作モデルの作成の流れ 学習データの収集 学習データの加⼯ モデルの作成・学習 モデルの完成 精査 チューニング
  21. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 30 学習データの収集 学習データの収集 学習データの加⼯ モデルの作成・学習 モデルの完成 精査 チューニング
  22. Copyright © since 2017 DMM All Rights Reserved. 32 データの収集

    ①オープンなデータセットを使うパターン 例: Google提供 The Open Images Dataset
  23. Copyright © since 2017 DMM All Rights Reserved. 33 イラストのオープンなデータセットはない

    ※研究⽤途では、 ニコニコ静画のイラストデータセットなどが存在 https://nico-opendata.jp/ja/index.html データの収集
  24. Copyright © since 2017 DMM All Rights Reserved. 34 データ収集

    ②⾃社保有のコンテンツ データの収集
  25. Copyright © since 2017 DMM All Rights Reserved. 35 検索

    ③Webから取得 データの収集
  26. Copyright © since 2017 DMM All Rights Reserved. 37 かわいい

    イラスト 検索 Bing Search API データの収集
  27. Copyright © since 2017 DMM All Rights Reserved. 38 かわいい

    イラスト 検索 Bing Search API データ収集 データの収集
  28. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 40 学習データの精査 学習データの加⼯ モデルの作成・学習 モデルの完成 精査 チューニング 学習データの収集
  29. Copyright © since 2017 DMM All Rights Reserved. 41 画像を⽬で確認

    ⽬grep 乱雑なデータ 精査したデータ ⽬grep
  30. Copyright © since 2017 DMM All Rights Reserved. 42 ⽬grep

    乱雑なデータ 精査したデータ ⽬grep とてもたいへん
  31. Copyright © since 2017 DMM All Rights Reserved. 43 ⽬grep

    乱雑なデータ 精査したデータ ⽬grep 現在、 機械的処理に挑戦中
  32. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 44 学習データの加⼯ 学習データの収集 学習データの加⼯ モデルの作成・学習 モデルの完成 精査 チューニング
  33. Copyright © since 2017 DMM All Rights Reserved. 47 データ加⼯

    アニメ顔検出: OpenCV + カスケード分類器 https://github.com/nagadomi/lbpcascade_animeface
  34. Copyright © since 2017 DMM All Rights Reserved. 49 データ加⼯

    なぜこのような処理をする? メリット: ノイズ除去により少ないデータで精度がでる デメリット: 顔画像の取得有無に左右される
  35. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 50 モデルの作成・学習 学習データの収集 学習データの加⼯ モデルの作成・学習 モデルの完成 精査 チューニング
  36. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 51 Deep Learningの利⽤ Deep Learning を⼀から 学んで利⽤するのは難しそう...
  37. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 52 Deep Learning: 実装⾯ ライブラリ 言語 TensorFlow Python, C++ Caffe Python, C++ Chainer Python Torch7 Lua H2O R, Python Deeplearning4j Java/Scala (JVM言語) Deep Learning の利⽤までの学習や実装がたいへんではないか? ・Tensorflow や Caffe などの Deep Learning ライブラリの利⽤
  38. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 53 Deep Learning: 実装⾯ ライブラリ 言語 TensorFlow Python, C++ Caffe Python, C++ Chainer Python Torch7 Lua H2O R, Python Deeplearning4j Java/Scala (JVM言語) ① 過去の資産が豊富 ② NVIDIAのDeepLearning 学習ツールDIGITSが便利 Deep Learning の利⽤までの学習や実装がたいへんではないか? ・Tensorflow や Caffe などの Deep Learning ライブラリの利⽤
  39. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 54 Deep Learning ⽤の環境の準備が⼤変ではないか? ・Cloudサービスで簡単にGPU環境が使える Deep Learning: 環境⾯ IDCF クラウド (M40 インスタンス) NVIDIA Tesla M40
  40. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 55 Deep Learning: モデルの作成と学習 モデルの作成と学習を実装するのが⼤変ではないか? ・NVIDIA DIGITS の活⽤ …GUI上でデータセット作成, モデル作成・学習, 結果の確認が可能
  41. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 56 既存モデルの利⽤ Deep Learning: モデルの作成と学習
  42. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 57 モデルの構築 Deep Learning: モデルの作成と学習
  43. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 58 モデルのチューニング 学習データの収集 学習データの加⼯ モデルの完成 精査 チューニング モデルの作成・学習
  44. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 59 学習曲線から汎化能⼒と過学習の有無を判断しパラメータをチューニング 30 epoch 200 epoch Deep Learning: モデルのチューニング
  45. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 60 30 epoch 200 epoch 過学習 汎化誤差と学習誤差に ⼤きな差がある - Dropoutの調整 - ユニット数・レイヤー数の調整 Deep Learning: モデルのチューニング 学習曲線から汎化能⼒と過学習の有無を判断しパラメータをチューニング
  46. Copyright © since 2017 DMM All Rights Reserved. 61 実装した画像レコメンドの例

    ※ 著作権等の理由のため公開資料に関しては このセクションのスライドを省いております
  47. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 63 まとめ 商品のパッケージ画像が類似した商品をレコメンド ・画像特徴を算出するモデルの作成 • 学習データやモデルの作成に関して説明 • 学習データ周りは泥臭いことが多々 • ライブラリ等を活⽤すればDeep Learning⾃体の実装は簡単 課題はあるが簡単に様々なサービスへ活⽤可能
  48. Copyright © since 2017 DMM All Rights Reserved. Copyright ©

    since 2017 DMM All Rights Reserved. 64 今後の展開 ディープラーニングの動画への適応を予定 ・動画のシーン抽出 ・今後、IDCF主催のイベントで発表予定