新規検索基盤でマッチング精度向上に挑む！～『ホットペッパーグルメ』の開発事例技術編

Slide 1

Slide 1 text

新規検索基盤でマッチング精度向上に挑む！～『ホットペッパーグルメ』の開発事例 RECRUIT TECH CONFERENCE 2025 技術編須藤遼介株式会社リクルートプロダクトディベロップメント室

Slide 2

Slide 2 text

須藤遼介ゲーム・NBA観戦・ラーメン経歴 / Career 2019年にリクルートにキャリア採用入社。機械学習エンジニアとして各種領域を担当 2024年より飲食領域の検索基盤開発・ロジック開発を担当趣味 / Hobbies データ推進室販促領域データソリューション３ユニット（飲食・ビューティー）飲食・ビューティーデータソリューション部飲食・ビューティーデータエンジニアリングG

Slide 3

Slide 3 text

新規検索基盤の構築

Slide 4

Slide 4 text

高速な仮説検証を実現する上での現行基盤の課題データ連携の各操作を行う際に連携が必要な組織が多い ● インデックスへのデータ再連携は BatchTに依存する ● 特徴量の追加のためにはデータ組織から横断検索基盤Tへデータの受け渡しが必要実験のための工数が増大し仮説検証実施が遅れてしまうオンプレ基盤 Batchチーム横断検索基盤チームデータ組織データ投入事業DB 中間DB データ抽出データ・スキーマ更新依頼データ投入検索エンジン

Slide 5

Slide 5 text

新規検索基盤の目標 ● データ組織主導による仮説検証の実施 ○ 新規Mappingの設定 ○ インデックスの再作成・複数運用 ○ 特徴量の追加 ● 検索システムへのMLモデルの導入 ○ VectorSearch(Dense/Sparse) ○ Hybrid Search ○ Reranker データ組織データ投入スキーマ・ロジック変更検索エンジン店舗情報 0.4, 0.8, 0.1 0.6, 0.9, 0.5 0.3, 0.7, 0.2 検索クエリ 0.6, 0.9, 0.5 kNN 検索エンジン

Slide 6

Slide 6 text

Amazon OpenSearch Serviceの導入検索エンジンとしてOpenSearchを導入 ● 現行のElastic Searchからの資産が活かせる ○ SearchTemplate / Index Mapping ● 無停止アップグレードに対応 ○ Blue/Green Deploy ● マネージドのETLツールも用意 ● 基本的なベクトル検索やHybrid Searchに対応 ● AWSで構築された社内ML基盤との連携が容易社内のAWSで構築された API/Job基盤 Amazon OpenSearch Service Amazon OpenSearch Ingestion

Slide 7

Slide 7 text

Dynamo DBをマスタDB としたインデックス構築差分データの集約先としてDynamoDBを利用 OpenSearchIngestionを利用して OpenSearchとデータ連携マスタデータとしてDynamoDBを利用することでOpenSearchの再作成が容易 ● Ingestion接続時からデータ連携開始 ● 連携中に送られた差分データも随時連携設定更新のハードルが下がり仮説検証がしやすくなる差分データ新規インデックス設定付与接続したタイミングでデータ連携開始 index index 実験用 index 差分データ随時連携接続後の更新データも下流にそれぞれ連携

Slide 8

Slide 8 text

検索API: Query Proxy リクエストを処理するAPI MLモデルによる推論もここで実行 ● Planner: 検索ロジックの判断 ● QueryBuilder: OSへのクエリ生成 ● Executor: Queryの並列実行 ● Aggregation: 結果の集約 API内でのRerankやHybridSearchに対応 OpenSearchの機能に制限されない柔軟なロジック構築が可能 Planner QueryBuilder Lexical Search QueryBuilder Vector Search Executor Lexical Search Results Vector Search Results Aggregation (RRF, Reranker) Results Query Amazon OpenSearch Service

Slide 9

Slide 9 text

実際に運用してみて ● インデックスの再作成のハードルは非常に下がった ○ Mappingの変更などは非常に簡単に行える ● OpenSearchIngestionはかなりハマりポイントが多かった ○ 更なるドキュメントの拡充を期待！ ● OpenSearchのベクトル検索機能は限定的 ○ ベクトル検索の機能を外出しするのは必須の判断だったかも

Slide 10

Slide 10 text

検索ロジックの改善

Slide 11

Slide 11 text

ベクトル検索の投入 Two-Towerベースのモデル ● クエリと店舗情報で異なる Encoderを用いる ● クエリとドキュメントのペアによる対照学習従来ロジックよりクエリの揺らぎに強い検索ができる東京　焼肉リクルートクラフトビールホルモン炎居酒屋リクルートビール三昧八重洲堂 1.0 1.0 1.0 0.0 0.0 0.0 0.0 0.0 0.0 ユーザクエリ東京焼き肉店舗情報店名/住所/メニュー… Query Encoder Document Encoder Query Embedding Document Embedding ペア Score クエリ店舗ペア同士のスコアが高くなるように学習

Slide 12

Slide 12 text

ベクトル検索導入の課題と対応策 OS上でのHybrid Search実現の諸々 Hybrid Searchの方が全体として高精度課題 (※OSで実施する上で) ● Pagination非対応 ● スコアの統合機能が弱い対応策 API上で諸々実装 ● TopN件のみHybrid Searchをして全文検索へフォールバックさせる ● API上でスコアのマージを実装する OpenSearchの機能制約に制限されずロジック実現 Pagination非対応だが高精度なロジック Paginationに対応したロジック Planner QueryBuilder Lexical Search QueryBuilder Vector Search Executor Lexical Search Results Vector Search Results Aggregation (RRF, Reranker) Results Query ロジック間で重複が起きないように制御 1 N N+1

Slide 13

Slide 13 text

ロジック改善の結果初回ABの結果 ● 検索経由でのCV数が+10%近く改善 ● 0件ヒット率90%近く削減現在も継続的なABテストを実施中 ※検証中のため利用できるユーザは限定されています

Slide 14

Slide 14 text

まとめ基盤 ● 設定変更・再構築のしやすい検索システムを構築 Open Search/Ingestion/DynamoDB ● API上でHybridSearch/Rerankingを行うことでOSの制約にとらわれないロジックの実装に対応ロジック ● Two-Towerモデルを中心にしたベクトル検索ロジックを作成 ● 各種精度向上の工夫により本番ABテストで10%近くのCV向上を実現