相互推薦システムでのPseudo Label を活用したマッチ予測精度向上の取り組み

© 2025 Wantedly, Inc. 相互推薦システムでのPseudo Label を活用したマッチ予測精度向上の取り組み Feb. 27
2025 - 林悠大 (ウォンテッドリー株式会社) DEIM 2025 技術報告 [3F-05]

© 2025 Wantedly, Inc. 自己紹介林　悠大経歴 • 2022年3月：東京大学大学院工学系研究科でPh.D 取得
• 2022年4月：ウォンテッドリー株式会社にデータサイエンティストとして新卒入社。推薦システムの開発に従事

© 2025 Wantedly, Inc. Agenda 1. 企業紹介 ◦ 会社とプロダクトの紹介 ◦
プロダクトにおけるデータサイエンスの活用事例 ◦ アカデミアにおける活動 2. マッチングプラットフォームにおける推薦の難しさ ◦ マッチングプラットフォームでの推薦の特徴 ◦ 相互推薦システムとその難しさ 3. Pseudo Labelによるマッチング予測モデルの性能向上 ◦ 提案手法 ◦ オフラインテストの結果と考察

© 2023 Wantedly, Inc. 究極の適材適所により、シゴトでココロオドルひとをふやす © 2025 Wantedly, Inc.
私たちのミッション

© 2025 Wantedly, Inc. • 個人と企業がフラットな目線で出会えることで、より魅力的な場所を見つけることが可能に会社に遊びに行こうミッションや価値観への共感でマッチング •
会社の Why と What が伝えられる場所 • 人と会社を「想い」でマッチング｢話を聞きに行く」体験会社訪問アプリ「Wantedly Visit」

© 2025 Wantedly, Inc. アカデミアにおける活動 RecSys2024への参加国内学会のスポンサー https://confit.atlas.jp/guid e/event/deim2024/top DEIM2024
JSAI2024 https://www.ai-gakkai.or.jp/jsai2024/sponsor

© 2025 Wantedly, Inc. Wantedly Visitにおけるスカウト推薦の構造ユーザー企業 • 企業がユーザーにスカウトを送る
• ユーザーが企業に興味を持って返信する両者の嗜好が合致して初めてマッチが成立マッチングシステムの推薦の難しさ • 正解ラベルがスパース • 両サイドの嗜好をバランスよく考慮する必要がある

© 2025 Wantedly, Inc. 正解ラベルがスパースユーザーが気になる興味がない興味がない会社が気に
なる ◯ マッチ成立 ☓ スカウト返信が来ない ☓ スカウト送信されない ☓ 何も起きないジョブマッチングサービス ECサービスアイテムが気になる興味がない ◯ 購入 ☓ 購入しないマッチングサービスでは、推薦の成功（マッチ)を表すラベルが非常にスパース → マッチを直接予測しようとすると難易度が高い

© 2025 Wantedly, Inc. 相互推薦モデルによるスパーシティの緩和相互推薦システムスカウト送信予測スカウト返信予測
集約最終スコア • メリット ◦ 各コンポーネントのラベルはマッチよりは多い→スパーシティの課題が緩和 ◦ 両サイドの嗜好を別々に学習しているため、嗜好のバランスを調整しやすい • デメリット ◦ 確率のスケールが異なる2つのモデルの予測値を集約していることにより、最終スコアの誤差が大きくなりやすい e.g. 単純積、調和平均

© 2025 Wantedly, Inc. Pseudo Labelによるマッチング予測モデルの性能向上 S. Goda, Y.
Hayashi and Y. Saito, arXiv:2409.10992v2 (2024)

© 2025 Wantedly, Inc. 既存手法の良い点と課題マッチラベルを直接学習相互推薦モデルを利用良い点課題シングルモデルなので誤差
の影響が比較的小さい 2つのモデルの確率のスケール差が誤差に影響スパーシティの問題が比較的小さい正解ラベルのスパーシティにより学習の難易度が高い 2つのモデルを組み合わせることで、両者の利点を活かせると期待

© 2025 Wantedly, Inc. 提案手法スカウト送信予測スカウト返信予測集約
予測値正解ラベルスカウトマッチ予測最終スコアこれまでの相互推薦モデル • 相互推薦のモデルをベースとした2段からなる推薦システムを提案 • 最終スコアを1モデルで計算するため、誤差の伝搬が抑えられ、精度向上が期待される疑似ラベルを作成してモデルを学習 1段目 2段目 1- α α の割合で混ぜ合わせる

© 2025 Wantedly, Inc. 提案手法 - マッチのスパース性の緩和正解ラベル相互推薦モデルの予測値スパース
密相互推薦モデルの獲得した情報を活用することで、ターゲットラベルを密に

© 2025 Wantedly, Inc. 実験手法 • データ：Wantedly Visitでのスカウト推薦のデータを利用 (2023/11 ~
2024/2) ◦ コンテンツデータ：Wantedly Visit上でのユーザーのプロフィール ◦ 行動データ：Wantedly Visit上でのユーザーの行動ログ • 評価指標：NDCG@10 • ベースライン： ◦ 相互推薦モデル ◦ 相互推薦モデルの部分モデル (スカウト送信予測モデル、返信予測モデル) • 実験パターン： 1. すべての採用担当者に対して、同じ比率で予測値を混ぜ合わせて学習 2. 採用担当者の行動量セグメントごとに予測ラベルの比率を変えて学習

© 2025 Wantedly, Inc. 結果 - 混ぜ合わせる予測値の比率による性能変化混ぜ合わせる予測値の割合をαで制御 αはすべての採用担当者で共通正解ラベル
予測値正解ラベルの割合が 25 %のときに最も指標が高くなり、ベースラインと比較して向上が見られた c: 企業(company) j: ユーザー(job seeker) 1段構成 2段構成

© 2025 Wantedly, Inc. 結果 - セグメントごとに擬似ラベルの比率を変える採用担当者の行動量が多い順に High, Middle,
Lowのセグメントを切り、手法の効果を比較 • High セグメントで大きな性能向上が見られた • Highセグメントではα=0.0が最適だが、Lowセグメントではα=0.75が最適 • セグメントごとにαを変えることで、NDCG@10 が 0.1021 → 0.1050 に向上 1段構成のモデルがベースライン

© 2025 Wantedly, Inc. 考察行動量セグメントごとに、相互推薦モデルの予測値の質が大きく異なっていた可能性 ① High Segmentで提案手法による大きな精度改善が見られた行動量が少ない採用担当者
• モデルの学習に使えるログが少ない • 正解ラベルの数が少ない行動量が多い採用担当者 • モデルの学習に使えるログが多い • 正解ラベルの数が多い相互推薦モデルの予測値に有益な情報が少なかった相互推薦モデルの予測値に有益な情報が多かった

© 2025 Wantedly, Inc. 考察行動量セグメントごとに、相互推薦モデルの予測値の質が大きく異なっていた可能性 ② セグメントごとに最適なαに差が見られた α (正解ラベル
の割合) 行動量が少ない採用担当者行動量が多い採用担当者密な予測値に有益な情報が多く含まれているので、正解ラベルはあまりいらない予測値はノイズが多いので、正解ラベルの情報が多く必要

© 2025 Wantedly, Inc. まとめ • 疑似ラベルを用いることで、マッチラベルのスパース性を緩和し、相互推薦モデルの性能を向上させることができた • 行動量の多い採用担当者に対して今回の手法が有効であることを検証
• より細かく採用担当者ごとに正解ラベルの比率をパーソナライズすることは今後の課題

相互推薦システムでのPseudo Label を活用したマッチ予測精度向上の取り組み

相互推薦システムでのPseudo Label を活用したマッチ予測精度向上の取り組み

Yudai Hayashi

More Decks by Yudai Hayashi

Featured

Transcript

© 2025 Wantedly, Inc. 相互推薦システムでのPseudo Label を活用したマッチ予測精度向上の取り組み Feb. 27

© 2025 Wantedly, Inc. 自己紹介林　悠大経歴 • 2022年3月：東京大学大学院工学系研究科でPh.D 取得

© 2025 Wantedly, Inc. Agenda 1. 企業紹介 ◦ 会社とプロダクトの紹介 ◦

© 2025 Wantedly, Inc. 企業紹介

© 2023 Wantedly, Inc. 究極の適材適所により、シゴトでココロオドルひとをふやす © 2025 Wantedly, Inc.

© 2025 Wantedly, Inc. • 個人と企業がフラットな目線で出会えることで、より魅力的な場所を見つけることが可能に会社に遊びに行こうミッションや価値観への共感でマッチング •

© 2025 Wantedly, Inc. 事例紹介：相互推薦システムの開発・改善

© 2025 Wantedly, Inc. アカデミアにおける活動 RecSys2024への参加国内学会のスポンサー https://confit.atlas.jp/guid e/event/deim2024/top DEIM2024

© 2025 Wantedly, Inc. マッチングプラットフォームにおける推薦の難しさ

© 2025 Wantedly, Inc. Wantedly Visitにおけるスカウト推薦の構造ユーザー企業 • 企業がユーザーにスカウトを送る

© 2025 Wantedly, Inc. 正解ラベルがスパースユーザーが気になる興味がない興味がない会社が気に

© 2025 Wantedly, Inc. 相互推薦モデルによるスパーシティの緩和相互推薦システムスカウト送信予測スカウト返信予測

© 2025 Wantedly, Inc. Pseudo Labelによるマッチング予測モデルの性能向上 S. Goda, Y.

© 2025 Wantedly, Inc. 既存手法の良い点と課題マッチラベルを直接学習相互推薦モデルを利用良い点課題シングルモデルなので誤差

© 2025 Wantedly, Inc. 提案手法スカウト送信予測スカウト返信予測集約

© 2025 Wantedly, Inc. 提案手法 - マッチのスパース性の緩和正解ラベル相互推薦モデルの予測値スパース

© 2025 Wantedly, Inc. 実験手法 • データ：Wantedly Visitでのスカウト推薦のデータを利用 (2023/11 ~

© 2025 Wantedly, Inc. 結果 - 混ぜ合わせる予測値の比率による性能変化混ぜ合わせる予測値の割合をαで制御 αはすべての採用担当者で共通正解ラベル

© 2025 Wantedly, Inc. 結果 - セグメントごとに擬似ラベルの比率を変える採用担当者の行動量が多い順に High, Middle,

© 2025 Wantedly, Inc. 考察行動量セグメントごとに、相互推薦モデルの予測値の質が大きく異なっていた可能性 ① High Segmentで提案手法による大きな精度改善が見られた行動量が少ない採用担当者

© 2025 Wantedly, Inc. 考察行動量セグメントごとに、相互推薦モデルの予測値の質が大きく異なっていた可能性 ② セグメントごとに最適なαに差が見られた α (正解ラベル

© 2025 Wantedly, Inc. まとめ • 疑似ラベルを用いることで、マッチラベルのスパース性を緩和し、相互推薦モデルの性能を向上させることができた • 行動量の多い採用担当者に対して今回の手法が有効であることを検証

© 2025 Wantedly, Inc. We’re hiring!