立ち上げ期のサービスでレコメンドを導入した際の機械学習モデルの開発とアーキテクチャの事例

立ち上げ期のサービスでレコメンドを導入した際の機械学習モデルの開発とアーキテクチャの事例  株式会社DROBE CTO 都筑友昭 

自己紹介  都筑友昭株式会社DROBE CTO 新卒で半導体の会社に就職ソーシャルゲームの開発やコンサルティング会社を経て2019年より株式会社 DROBE の CTO
機械学習よりはサービス / システム開発を得意としています出身地　: 千葉県他　　　: 2児の父

検索からパーソナライズへ  SEARCH PERSONALIZATION

サービス立ち上げ期の課題  1. 開発メンバーが足りない 2. 専門家が居ない 3. データが無い 4. パーソナライズ機能の設計と運用の経験が無い

DROBE というサービスの立ち上げを事例としてあらゆるリソースが足りない中でどうやってパーソナライズ機能を開発したかについてお話しします本日お伝えすること 

1 DROBEとは 

DROBEのマイルストーン  従業員家族・知人約200名にサービス提供  クローズドβ開始  一般の方向けにオンラインでの集客を開始  オープンβ開始  AIを活用したサービス提供開始  正式リリース  AIを用いて推薦された商品を直接購入できる機能  ストア機能リリース  事前提案機能を大幅に更新
  単品のレコメンドだけではなくアイテムの集合をレコメンド  2019.06 2019.09 2020.03 2020.10 2021.04 2022.05 パーソナライズ EC の実証実験開始   B2Bでレコメンドモデルの提供開始 

スタイリストがつくネットショッピング  8 70問のアンケートに答える  1 2 3 自宅にスタイリストが選んだ商品が届く  気に入ったもののみ購入、  それ以外を返品 

スタイリストが使う商品検索画面 

ユーザーに直接商品を提案する機能 

カテゴリや色などのバランスを加味しつつ提案を作る 

DROBEのマイルストーン  従業員家族・知人約200名にサービス提供  クローズドβ開始  一般の方向けにオンラインでの集客を開始  オープンβ開始  AIを活用したサービス提供開始  正式リリース  AIを用いて推薦された商品を直接購入できる機能  ストア機能リリース  事前提案機能を大幅に更新
  単品のレコメンドだけではなくアイテムの集合をレコメンド  2019.06 2019.09 2020.03 2020.10 2021.04 2022.05 パーソナライズ EC の実証実験開始   B2Bでレコメンドモデルの提供開始 

2 パーソナライズ機能 

パーソナライズ機能  • 一人一人のユーザーに合わせて商品やコンテンツを最適化する機能     • 性年代といったユーザーの属性情報やサイト内での行動を元に、最適化する     •
機械学習等によるレコメンドや事前に設定したルール、またそれらの組み合わせで実現される  

パーソナライズ機能を実現するには？  1. データを貯めて    2. レコメンドモデルを開発し    3. 機能設計をする 

データを貯める  1

課題1 どんなデータを貯めれば良いかわからない  機械学習に使えそうだという仮説が立てられそうなデータにフォーカスする  

課題2 データの規模・更新頻度などが予測できない  マネージドサービスを使う

データパイプライン  必要最小限のデータにフォーカスしたマネージドサービスで構築したデータパイプライン 

データパイプライン  データソースは RDB に永続的に保存されたデータにフォーカス  弊社の事業特性上重要だと考えられるデータが RDB に保存されているデータであるという仮説に基づいた意思決定 

データパイプライン  Amazon CloudWatch と StepFunction で簡易的なワークフローを実現 

データパイプライン  データの抽出、変換、ロードを AWS Glue によって行う事い将来的な大規模に備える 

データパイプライン  parquet 形式でデータを Data Lake (S3) に保存し、Amazon Athena や SageMaker、local
マシンなどで使う 

Data Lake の実体 

貯めたデータの活用  • 毎日の Data warehouse のスナップショットを zip に固めてアーカイブしておくと便利 ◦ ビジネス職のメンバーや社外のエンジニアと簡単にシェア出来る
◦ 再現性のある検証や開発が出来る

• データパイプラインは特別な理由が無い限りマネージドサービスを使う • データは共有しやすい形式で保存しておくデータを貯めるまとめ 

レコメンドモデルを開発する  2

課題1 アルゴリズムの種類が多すぎる  Context-Aware Recommendation Pop ItemKNN BPR NeuMF ConvNCF DMF
FISM NAIS SpectralCF GCMC NGCF LightGCN DGCF LINE MultiVAE MultiDAE MacridVAE CDAE LR FM NFM DeepFM xDeepFM AFM FFM FwFM FNN PNN DSSM WideDeep DIN DIEN DCN AutoInt XGBOOST LIGHTGBM FPMC GRU4Rec NARM STAMP Caser NextItNet TransRec SASRec BERT4Rec SRGNN GCSAN GRU4RecF SASRecF FDSA S3Rec GRU4RecKG KSR FOSSIL SHAN RepeatNet CKE CFKG KTUP KGAT RippleNet MKR KGCN KGNNLS General Recommendation ENMF NNCF RaCT RecVAE EASE SLIMElastic SGL ADMMSLIM NCEPLRec SimpleX NCL Sequential Recommendation Knowledge-based Recommendation HGN HRM NPE LightSANs SINE CORE

課題1 アルゴリズムの種類が多すぎる  自社サービスの仕様や要件をまとめ、相性が良さそうなアルゴリズムの仮説をたてる

DROBE のレコメンドに関わる仕様や制約条件  • サインアップ時に豊富なユーザーデータを取得出来る • ユーザーが能動的に商品を探索などしないので行動ログがほぼ使えない (当時) • ユーザーからは返品も含め明示的なフィードバックが得られる •
商品の種類が豊富 • 商品の入れ替わりが激しい • 利用の間隔が長いユーザーが多いサービスの特徴相性が良さそうなアルゴリズム • ID だけではなくユーザーやアイテムの特徴を使える • 明示的フィードバックを利用可能

Context-Aware Recommendation Pop ItemKNN BPR NeuMF ConvNCF DMF FISM NAIS
SpectralCF GCMC NGCF LightGCN DGCF LINE MultiVAE MultiDAE MacridVAE CDAE LR FM NFM DeepFM xDeepFM AFM FFM FwFM FNN PNN DSSM WideDeep DIN DIEN DCN AutoInt XGBOOST LIGHTGBM FPMC GRU4Rec NARM STAMP Caser NextItNet TransRec SASRec BERT4Rec SRGNN GCSAN GRU4RecF SASRecF FDSA S3Rec GRU4RecKG KSR FOSSIL SHAN RepeatNet CKE CFKG KTUP KGAT RippleNet MKR KGCN KGNNLS General Recommendation ENMF NNCF RaCT RecVAE EASE SLIMElastic SGL ADMMSLIM NCEPLRec SimpleX NCL Sequential Recommendation Knowledge-based Recommendation HGN HRM NPE LightSANs SINE CORE DROBE のレコメンドと相性が良さそうなアルゴリズム  この辺りのアルゴリズムの相性が良さそう

課題2 チームに専門家が居ない  機械学習に詳しくなくてもマネージドサービスや OSS などを利用した開発は可能  

開発の方針  マネージド独自実装 OSS 実装難易度本番化難易度カスタマイズ性具体的選択肢中低
中低中低 DLRM 高高高

開発の方針  Managed 独自実装 OSS 実装難易度本番化難易度カスタマイズ性具体的選択肢中低
中低中低 DLRM 高高高 DROBEの場合は • ある程度知識のある ML エンジニアが居た • レコメンドをサービスの中で重要な機能と位置付けた • 想定している結果を出すまで PDCA を回す前提という事を背景に、OSS を中心に検証を開始

検証中に出てきた問題  • 学習は回るがパーソナライズされない • 一般的に使われるメトリクス (Accuracy や Precision) だけだとサービスにとって良いレコメンドかどうかの判断がつかない
同じランキングが別のユーザーに提案されてしまう (パーソナライズされない )

定性評価  最終的にはスタイリストの定性的評価を軸として意思決定を行った具体的には各モデルで出したランキングを表にしてスタイリストに評価してもらった

https://arxiv.org/pdf/1507.08439.pdf LightFM  Metadata Embeddings for User and Item Cold-start Recommendations
という論文の python 実装主な特徴 • user, item 両方の cold start 問題に対応出来る • Cython を使って書かれているため CPU でもある程度高速に動作する

レコメンドモデルの開発まとめ  • 自社サービスの特徴を踏まえどういったアルゴリズムが良さそうかの当りをつける     • チームの状況に合わせ実装方法を選択する    
• 導入初期には定量的な数値だけではなく、定性的な意見も含めて意思決定を行う  

機能として設計する  3

課題レコメンドやルールをどのように協調動作させるか  各種機能を Filter と Ranker (Sorter) と捉えて整理し、設計する  

DROBE における Filter  • サイズがマッチしない商品は推薦しない  • ユーザーが嫌いと答えた特徴を持つ商品は推薦しない  • 既に購入済みの商品は推薦しない  •
在庫がない商品は推薦しない  • 販売不可能な商品は推薦しない 

DROBE における Filter  • サイズがマッチしない商品は推薦しない  • ユーザーが嫌いと答えた特徴を持つ商品は推薦しない  • 既に購入済みの商品は推薦しない  •
在庫がない商品は推薦しない  • 販売不可能な商品は推薦しない  検索エンジン機械学習モデル

DROBE における Ranker  • サービス全体のランキング  • 価格順  • 新着順  •
ユーザー毎にパーソナライズされたランキング 

DROBE における Ranker  • サービス全体のランキング  • 価格順  • 新着順  •
ユーザー毎にパーソナライズされたランキング  検索エンジン機械学習モデル

DROBE のパーソナライズ機能  • Filter と Ranker を実装とマッピング   • 協調動作部分はバックエンドのロジックとして実装
する  ◦ どういった順番で Filter と Ranker を適用してクライアントにレコメンドするアイテムを返すのか 

3 本番運用 

API としてモデルを動作させる  API サーバーとしてモデルを動作させるにはコンテナにしてしまうのが簡単 (CPU で動作可能な場合は特に )

API としてモデルを動作させる  モデルトレーニング用のコードも同じコンテナに持ち、コンテナ内部でトレーニングし結果を docker commit する

API としてモデルを動作させる  推論時にはコンテナ起動時に weight を Model が読み込んで初期化し、 API サーバーがリクエストを受けて
Model の推論機能を呼び出す

本番化を踏まえたデータパイプラインの設計 

モデルのトレーニングとデータパイプライン  複雑化する ETL Workflow に対応するために Kubernetes 上で動く OSS の Workflow
エンジンを導入  ① Extract ① Extract ② Load ③ Transform

モデルのトレーニングとデータパイプライン  トレーニングは CodePipleine で行う  Build して Push するコンテナイメージ

動作確認と評価  stg や QA 環境はデータが本番と違う場合が多い     レコメンドモデルは本番のデータを使ってトレーニングする事が多い    
本番のデータを使ってトレーニングしたレコメンドモデルを QA 環境にあげても API の動作確認は出来るがモデルの動作確認は難しい  

カナリアリリース 

カナリアリリース  機械学習 API の数が増えても管理可能     ArgoCD を使う事で GitOps での運用が行えるの
で、AB テストなども比較的容易に行える  

機械学習 API 全体像  DROBE の場合、モデルは CPU で動作可能スケーラビリティと本番環境へのカナリアリリースを考えて EKS +
istio で機械学習 API を運用

• 開発と本番で同じデータを使えるようにしておく     • CPU で動作させる事ができれば通常の Web インフラが使える  
  • 機械学習機能は動作確認や性能の判断が困難な場合が多いので、本番環境で検証出来る仕組みを考えておく  本番運用まとめ 

まとめ 

まとめ本日お話したこと  あらゆるリソースが足りないスタートアップでも、パーソナライズ機能の導入は可能アルゴリズムの選定や評価を除けば基本的には Web の一般的な開発の知識だけでも機能の実装を行う事は出来る運用面では機械学習モデルがあるがゆえの難しさはある

We are hiring!!  60 採用情報 https://info.drobe.co.jp/jobs エンジニアリング資料 https://info.drobe.co.jp/engineering 少しでも気になった方、お気軽にご連絡ください!!  
カジュアルに技術話をするだけでも大歓迎です!   Twitter Meety

株式会社DROBE CTO 都筑友昭  ご清聴ありがとうございました! 

立ち上げ期のサービスでレコメンドを導入した際の機械学習モデルの開発とアーキテクチャの事例

立ち上げ期のサービスでレコメンドを導入した際の機械学習モデルの開発とアーキテクチャの事例

More Decks by tsuzuki

Other Decks in Technology

Featured

Transcript