汎用推薦システム Embedding基盤と BigQuery Vector Search で実現する高速システム構築

汎用推薦システム Embedding基盤と BigQuery Vector Search で実現する高速システム構築株式会社ZOZO データ・AIシステム本部データシステム部 MA推薦ブロック
伊藤瑠海 Copyright © ZOZO, Inc. 1

© ZOZO, Inc. 株式会社ZOZO データ・AIシステム本部データシステム部 MA推薦ブロック伊藤瑠海出身地
北海道札幌市趣味 / 特技筋トレ / ボクシング最近気になるもの Enhanced Games 2

© ZOZO, Inc. 3 AGENDA 本日の流れ 01 MA推薦ブロックの取り組み 02 従来の課題
03 解決策：汎用推薦システム 04 アーキテクチャ：6ステップのパイプライン 05 ぶつかった課題と対処 06 運用事例 07 今後の展望

© ZOZO, Inc. 4 01 MA推薦ブロックの取り組み MAシステムへの貢献内製化された配信基盤 MAシステムメール・Pushなどの複数チャネルへの
配信基盤を社内で開発 / 運用「誰に・いつ・どこで」配信するかを制御セールや新着など、施策ごとに配信を実行推薦によるパーソナライズ MA推薦 MA配信を一人ひとりにパーソナライズ例）既存のルールベース手法による配信アイテム選定・並び順をMLベース手法にリプレイス MA推薦のパーソナライズ結果をMA配信に掲載する

© ZOZO, Inc. 5 02 従来の課題「速さ」と「精度」のトレードオフ速さ機械学習ベース：
施策ごとにモデルを実装開発リードタイムが長い工程所要期間 EDA 約2週間モデルの設計・実装約3週間パイプラインの設計・実装約2週間実験・評価・チューニング約3週間 1施策あたりの開発リードタイム約2.5か月 ※ 開発工数はプロジェクトによって増減します精度ルールベース：行動ログに基づくルール潜在的な嗜好を捉えられない閲覧履歴やお気に入りブランドなど、顕在的な嗜好に基づく推薦が中心ルールの設計は比較的容易ルールの例「ブランドAを閲覧したユーザーに、ブランドAの値下げ商品を推薦する」「閲覧回数の多い人気商品を、多くのユーザーに推薦する」潜在的な嗜好を反映できないどちらか一方しか満たせず、速さと精度の両立ができていなかった

© ZOZO, Inc. 6 02 従来の課題求めていたのは「高速な構築 × 高い精度」の両立高い
低い速い遅い機械学習ベース精度◎／構築は遅いルールベース速い／精度に限界求めていたもの両立要求 01 ── 高速な推薦システム構築短期間で構築できる施策ごとにモデルを作り直さず推薦システムを短期間で立ち上げられること要求 02 ── 高い推薦精度潜在的な嗜好を捉えるユーザーの潜在的な嗜好を反映した推薦ができること速度精度

© ZOZO, Inc. 7 03 解決策：汎用推薦システム Embedding基盤 × BigQuery Vector
Search で構築社内のEmbedding基盤から取得した User / Item の Embedding を、BigQuery Vector Search でコサイン類似度を計算し関連の高いアイテムを推薦するシステムを構築した用語 Embedding基盤：共通の埋め込み空間にエンコードした User・Item のベクトル（Embedding）を提供する社内基盤 Two-Tower モデルで生成した Embedding User Tower › User Embedding … Item Tower › Item Embedding … › BigQuery × Vector Search 2つの Embedding のコサイン類似度を計算 › 推薦結果パーソナライズされた商品構築が速い従来必要だった特徴量作成・モデル学習が不要になり、開発リードタイムを短縮精度が高い Embeddingによりルールベースでは捉えられない潜在的な嗜好を反映

© ZOZO, Inc. 8 04 アーキテクチャ 6ステップのパイプライン（Vertex AI Pipelines） 1
セグメント抽出施策の対象となる User・Item（= セグメント）を抽出 › 2 Embedding抽出対象セグメントの Embedding を社内基盤から取得 › 3 Vector Index作成計算量削減のため candidate に Index を貼る › 4 Vector Search User と Item の類似度計算を実行 › 5 後処理施策ごとのスコアブーストフィルタリング › 6 評価・ポリシー定量評価・事前定義ポリシーで検証汎用たる所以 2つを差し替えるだけで、複数施策に利用可能 ① セグメント抽出：対象の User・Item を抽出する SQL を差し替え ⑤ 後処理：施策に合わせてスコアブースト・フィルタの条件を変更実行・連携パイプラインはBigQuery のジョブでバッチ実行配信連携：推薦結果を BigQuery に保存しMAシステムが読み込む

© ZOZO, Inc. 9 05 ぶつかった課題と対処ぶつかった2つの課題 ① Vector Index
の非同期構築 BigQuery の Vector Index は非同期で構築されるため、完了前に Vector Search を実行すると Index が使われず全件ブルートフォースで計算されてしまう影響実行時間とスロット消費が膨大になり、無駄なコストが発生 ② Vector Search のスロット消費 BigQuery Vector Search は大量のベクトル間の類似度を計算するため、1回の実行で大量のスロットを占有する影響共有の BigQuery 容量ベースプロジェクトでは他チームのクエリ遅延・タイムアウトを引き起こすリスク

© ZOZO, Inc. 05 ぶつかった課題と対処 2つの対処対処① — 非同期構築 Index
完了待ちを挟む 3 Vector Index 作成非同期で構築開始完了待ちポーリング INFORMATION_SCHEMA.VECTOR_INDEXES 完了まで 4 Vector Search 実行ブルートフォースを回避作成と Search の間に完了待ちを挟んで全件探索を回避対処② — スロット消費専用PJで実行して分離 × 共有スロットPJ — 他チームのジョブに影響 ↓ オンデマンド課金の専用PJに分離 ✓ 専用PJで Vector Search のみ実行今回のケースではスキャン量が少なかったため、オンデマンド課金の専用 PJ で実行することでコストを抑えつつ共有スロットへの影響を回避 10

© ZOZO, Inc. 11 06 運用事例開発リードタイムの短縮ある施策に汎用推薦システムを適用した際の開発リードタイム比較工程従来
汎用推薦システム EDA 約2週間不要（Embedding基盤を利用）モデルの設計・実装約3週間不要（Embedding基盤を利用）パイプラインの設計・実装約2週間約1週間（セグメント設定 + 既存基盤）実験・評価・チューニング約3週間約2週間（後処理によるチューニング） EDAとモデル開発が不要になったパイプライン再利用で各工程の工数も削減約2.5か月 ▶ 約3週間

© ZOZO, Inc. 12 06 運用事例 A/Bテストで主要KPIが向上 Control：ルールベース手法／ Treatment：汎用推薦システム
配信あたり MA経由流入数向上 ↑ 配信あたり MA経由購入数向上 ↑ 両指標とも Treatment が Control を統計的に有意に上回り、本番導入へ移行

© ZOZO, Inc. 13 07 今後の展望他のMAシステムへ適用を拡げ、Rerankerの導入でさらに高度化する横展開他のMAシステムへ汎用推薦
システム ⟩ MA施策 A MA施策 B MA施策 C 本システムを他の施策へ広げ汎用推薦の適用範囲を拡大開発中 Reranker の導入後処理ルールベース → Reranker （モデル）後処理に Reranker を適用し推薦精度の向上を目指す

汎用推薦システム Embedding基盤と BigQuery Vector Search で実...

汎用推薦システム Embedding基盤と BigQuery Vector Search で実現する高速システム構築

ZOZO Developers PRO

More Decks by ZOZO Developers

Other Decks in Technology

Featured

Transcript

汎用推薦システム Embedding基盤と BigQuery Vector Search で実現する高速システム構築株式会社ZOZO データ・AIシステム本部データシステム部 MA推薦ブロック

© ZOZO, Inc. 株式会社ZOZO データ・AIシステム本部データシステム部 MA推薦ブロック伊藤瑠海出身地

© ZOZO, Inc. 3 AGENDA 本日の流れ 01 MA推薦ブロックの取り組み 02 従来の課題

© ZOZO, Inc. 4 01 MA推薦ブロックの取り組み MAシステムへの貢献内製化された配信基盤 MAシステムメール・Pushなどの複数チャネルへの

© ZOZO, Inc. 5 02 従来の課題「速さ」と「精度」のトレードオフ速さ機械学習ベース：

© ZOZO, Inc. 6 02 従来の課題求めていたのは「高速な構築 × 高い精度」の両立高い

© ZOZO, Inc. 7 03 解決策：汎用推薦システム Embedding基盤 × BigQuery Vector

© ZOZO, Inc. 8 04 アーキテクチャ 6ステップのパイプライン（Vertex AI Pipelines） 1

© ZOZO, Inc. 9 05 ぶつかった課題と対処ぶつかった2つの課題 ① Vector Index

© ZOZO, Inc. 05 ぶつかった課題と対処 2つの対処対処① — 非同期構築 Index

© ZOZO, Inc. 11 06 運用事例開発リードタイムの短縮ある施策に汎用推薦システムを適用した際の開発リードタイム比較工程従来

© ZOZO, Inc. 12 06 運用事例 A/Bテストで主要KPIが向上 Control：ルールベース手法／ Treatment：汎用推薦システム

© ZOZO, Inc. 13 07 今後の展望他のMAシステムへ適用を拡げ、Rerankerの導入でさらに高度化する横展開他のMAシステムへ汎用推薦

14