Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ウォンテッドリーの推薦システム開発を支える評価とデプロイの仕組み

chimuichimu
October 30, 2024
320

 ウォンテッドリーの推薦システム開発を支える評価とデプロイの仕組み

chimuichimu

October 30, 2024
Tweet

Transcript

  1. 自己紹介 © 2024 Wantedly, Inc. 名前: 市村 千晃 所属と役割: •

    ウォンテッドリー株式会社 • データサイエンティスト • 推薦システムの開発、運用に従事 @chimuichimu1
  2. © 2024 Wantedly, Inc. iOS, Android and Web 気軽に会社訪問 ミッションや価値観への共感でマッチング

    • 給与や福利厚生などの条件ではなく、想いがあれば会社の規 模にとらわれない まず「話を聞きに行く」という新しい体験 • 個人と企業がフラットな目線で出会えることで、より魅力的な場 所を見つけることが可能に Wantedly Visit
  3. 「実験主義」を支える仕組み © 2024 Wantedly, Inc. 問題発見 課題定義 解決策の 実装 オフライン評

    価 デプロイ オンライン評 価 運用 「実験主義」を実現するための オフライン評価とデプロイの仕組みを紹介
  4. 過去に起きていた課題② 実験の品質に関する課題 © 2024 Wantedly, Inc. オフライン評価とオンライン評価の結果の乖離 • オフラインで指標が改善 →

    オンラインで指標が悪化、というケース • 要因の一つ:ユーザーが見るものとは異なる推薦を評価していた 推薦モデル ランキング データ 推論サーバー による処理 ユーザーが 見るリスト 評価していたもの 本来評価すべきもの • ユーザー指定のフィルタ • ルールベースの後処理 • etc.
  5. 取り組んだこと © 2024 Wantedly, Inc. オフライン評価用ライブラリを内製し、評価プロセスに活用 DataLoader 旧ランキング 新ランキング Reproducer

    旧ランキング 新ランキング Evaluator 評価結果 Config 使い回す処理を関数化したうえ Config ベースで評価を設定できるように
  6. 取り組んだこと © 2024 Wantedly, Inc. オフライン評価用ライブラリを内製し、評価プロセスに活用 DataLoader 旧ランキング 新ランキング Reproducer

    旧ランキング 新ランキング Evaluator 評価結果 Config 評価をするだけでなく、推薦結果を再現する ためのコンポーネントを実現
  7. 過去に起きていた課題 © 2024 Wantedly, Inc. デプロイまでのリードタイム 推薦基盤の推論サーバーの実装に2-3日程度必要 リリースに DS と推薦基盤エンジニアの2人が必要

    コミュニケーションロスによるリスク 推薦基盤エンジニアが DS 側の意図を汲み取り、実装する必要あり コミュニケーションロスにより、意図せぬリリースやオンラインテストが行われ るリスク
  8. 取り組んだこと © 2024 Wantedly, Inc. ランキングリリース用のインターフェースの定義 DS 推薦基盤 エンジニア XXの条件下で〇〇のランキン

    グデータを出して、テスト方法 は△△で... DS 従来 スキーマファイルに 必要な情報を記述 現在
  9. 得られた成果 © 2024 Wantedly, Inc. デプロイのリードタイム短縮 🎉 デプロイにかかる時間が 2-3日 →

    半日 まで短縮 オンラインテストを始めよう、と思ったその日に開始できる環境に データサイエンティスト単独でのデプロイが可能に 🎉 設定と実装が分離されたことで、DS 単独でも正確なデプロイが可能に
  10. もっと詳しく知りたい人へ © 2024 Wantedly, Inc. • 開発プロセス全般 ◦ ウォンテッドリーにおける推薦システム開発の流れ •

    オフライン評価 ◦ ウォンテッドリーにおける推薦システムのオフライン評価の仕組み • デプロイ ◦ オンラインテストしようと思った その日に開始できる環境を目指して ◦ データサイエンティストと効果的にコラボレーションするためのインター フェースづくり