Kaggleで鍛えたスキルの実務での活かし方　競技とプロダクト開発のリアル

RECRUIT TECH CONFERENCE 2026 Kaggleで鍛えたスキルの実務での活かし方競技とプロダクト開発のリアル阿内宏武　羽鳥冬星　中間康文

Agenda 1. 自己紹介 2. トピック１「Kaggle関連実績紹介」 a. 個人の実績紹介 b. 会社の実績紹介 3.
トピック２「こぼれ話」（対談） a. コンペを始めたきっかけ b. 思い出に残るハプニングや修羅場、印象的な出来事 4. トピック３「Kaggleの学びをどう仕事に活かしているか」 a. Two-Towerモデルと近似最近傍探索による候補生成の事例 b. 設計・レビューの向上／モデル案件の正しさ・全体設計への応用

阿内宏武オセロ / ギター経歴 / Career 2016年にリクルートに新卒入社。 2021年までDSとして『ゼクシィ』・『カーセン
サー』等の販促領域を担当現在はHR領域のデータサイエンスグループのマネジャー Kaggle Master https://www.kaggle.com/kannahashimoto 趣味 / Hobbies （株）インディードリクルートテクノロジーズデータサイエンス部　エージェントサービス・ダイレクトスカウトデータサイエンスグループ

羽鳥冬星ストリートファイター6、Kaggle 経歴 / Career 2015年にリクルートに新卒入社。シニアデータサイエンティスト DSとしてHR領域を中心として複数の領域のレコメンドモデルの改善に取り組む
Kaggle Master https://www.kaggle.com/toseihatori 趣味 / Hobbies (株)リクルートプロダクト開発データ推進室データテクノロジーユニットアジリティテクノロジー部アジリティアナリティクスグループ

中間康文アニメ・漫画・ゲーム・野球・釣り経歴 / Career 2021年にリクルートに新卒入社。 DSとして、HR領域の各プロダクトにおけるレコメンドシステムの改善に取り組む。 Two-Towerモデルと近似最近傍探索による候補
生成ロジック導入の案件が、リクルートのナレッジ共有イベント（FORUM）に選出される。 Kaggle Grandmaster。 https://www.kaggle.com/yasufuminakama 趣味 / Hobbies （株）インディードリクルートテクノロジーズデータサイエンス部　オンラインプラットフォームデータサイエンスグループ

阿内の実績紹介 RecSys Challenge 2025 1st 出典：Kaggle（https://www.kaggle.com/kannahashimoto）

羽鳥の実績紹介出典：Kaggle（https://www.kaggle.com/toseihatori）

中間の実績紹介出典：Kaggle（https://www.kaggle.com/yasufuminakama）

リクルートのKaggler事情 2名 12名〜 10名〜在籍しているKaggler

リクルートのKaggler事情直近実績・LLM 20 Questions　11th🏆 ・ISIC 2024 - Skin Cancer
Detection with 3D-TBP　5th🏆 ・RecSys Challenge 2025 1st🏆 conpass振り返りイベント RecSys Challenge 2025

リクルートのデータコンペ開催実績・クーポン購入予測コンペ(10年前) ・レストランの来店予約コンペ(8年前) ・宿/ホテルの推薦コンペ(2年前)

コンペを始めたきっかけ • 阿内 ◦ ふと、外部に自分の実績を示せることがないことに気づいたため • 羽鳥 ◦ 当時開催されていたTalking Dataというコンペが業務でやっている内容
に割と似ていて楽しそうだった • 中間 ◦ 学生時代の短期インターン ◦ 初Python、Kaggleの公開codeを見ながら勉強

思い出に残るハプニングや修羅場、印象的な出来事 • 阿内 ◦ ラストsubmissionの選択を朝やろうと言っていたのにリーダーが起きない ◦ 初参加ではしっかりPublic激強notebookを何も考えずにコピペして痛い目に会う •
羽鳥 ◦ 朝5時まで実装 & 提出をした結果めちゃくちゃshake downしてしまった ◦ 阿内さんと同じチームで何度もコンペに出て「もうちょっとで金メダルだったのに」を100回繰り返した • 中間 ◦ 複数人チームで、各自の予測ファイルから最終予測ファイルを作るときに、締切ギリギリまで粘ってやりがち

HR領域のプロダクトにおけるレコメンド • 求職者のレジュメや行動履歴に基づくレコメンド • メールでのレコメンド、アプリでのリアルタイムなレコメンドなど、面は様々 • レコメンド対象となる求職者と求人票のペアは、兆単位 • 2-stageレコメンドを採用
2nd-stage 1st-stage Reranker 求職者求人票候補生成高精度の並び替え計算量の削減

Two-Towerモデルの導入 • ルールベースの候補生成をTwo-Towerモデルに置き換えた • 計算効率の改善と候補生成の精度の改善どちらも狙う 1st-stage 求職者求人票候補生成ルールベースフィルター
→ Two-Towerモデル

Two-Towerモデル Embedding Encoder Feature • ニューラルネットワークで求職者と求人票をベクトル化 • それぞれ同じ空間に埋め込むことで、類似度を計算できる求職者求人票
Embedding Encoder Feature

近似最近傍探索求人票求職者 IT系 IT系に興味近似最近傍探索 • 近似最近傍探索により各求職者に近い求人票を指定件数だけ高速に取得可能 Encoder Feature
Embedding Embedding Encoder Feature

Two-Towerモデルと近似最近傍探索による候補生成 • 計算効率の改善 ◦ 求職者と求人票をTwo-Towerモデルでembeddingに変換 ◦ 近似最近傍探索により、各求職者に近い求人票を指定件数だけ取得 ◦ 計算量をコントロールできる •
精度の改善 ◦ 計算効率を維持しながら、候補生成の精度を改善することができる ▪ 特徴量を追加しても全体の計算効率はほとんど変わらない ▪ 機械学習モデルで改善しやすく、質的な改善が見込める ▪ コールドスタート問題にも対処

Kaggleの学びがどう活きたか？ • Kaggleで培われるのは手の速さと手数の多さ ◦ 手の速さ ▪ ベースライン作成 • Notebooks Grandmasterなので慣れている＆基本的なコードは流用できる
▪ 実験サイクル • conﬁgで特徴量やパラメータなど根本的な変更以外すぐ実験できる構成を採用 • 短納期での性能改善が求められた中、数週間でオフライン検証50回以上 ◦ 手数の多さ ▪ ネットワーク構造 • シンプルなものから始めて改善 ▪ 特徴量の処理方法 • 数値特徴量の処理は様々な処理を試す • カテゴリ特徴量のembeddingサイズは機械的に決定する • 順位のあるカテゴリ特徴量は重み付け含めてモデルに反映する ▪ 母集団 • クリックや応募など一通り試す

オフライン検証 1st-stageの候補生成の精度はRecallで評価 1. 学習データと評価データを用意 a. 行動が発生した求職者×求人票ペアのリスト b. 学習/評価は時系列の前後で分割 2. 学習データを使ってTwo-Towerモデルを学習
3. 評価データの全求職者と全求人票に対して埋め込みベクトルを計算 4. 近似最近傍探索で取得した求人票に対するRecallを計算オフライン検証において、+5%以上の改善を確認

成果 • 推論 ◦ レコメンド対象の増加に対応 ◦ 1st-stageのフィルター部分が約25倍高速化 ◦ 推論全体で約2倍高速化 •
KPI ◦ 閲覧数 +8.4% ◦ 応募数 +5.7%

トピック２「こぼれ話」（対談） a. コンペを始めたきっかけ b. 思い出に残るハプニングや修羅場、印象的な出来事 4. トピック３「Kaggleの学びをどう仕事に活かしているか」 a. Two-Towerモデルと近似最近傍探索による候補生成の事例 b. 設計・レビュー力の向上／モデル案件の正しさ・全体設計への応用

設計・レビューの向上／モデル案件の正しさ・全体設計への応用 • 阿内： ◦ Kaggleで勝敗を分けるのが、いかに正しいオフライン評価を行うか ◦ 正しいオフライン評価とは、オンライン評価と相関するような検証方法を設計&実行すること ▪ オンライン評価
= KaggleでいうとPrivateLeaderBoardはKaggle側だけが持っている正解データによる評価。ビジネスの現場だとA/Bテスト等で実際に得られるデータで行う評価 ◦ この設計にすごく力を入れてきたので実際にもこの観点で指摘できることは多い

設計・レビューの向上／モデル案件の正しさ・全体設計への応用 • 羽鳥 • 「これ怪しい」センサーが働く ◦ CVスコアが良すぎる → validation設計に誤りがあるかも。validationに過度にﬁt したハイパーパラメータチューニングがされているかも
◦ 特徴量重要度の上位に不自然なものがある → 特徴量作成時にリークしてるかも • 評価指標の妥当性判断 ◦ RMSE -> 大きい値に敏感、MAPE -> 小さい値に敏感 ▪ どちらを案件の評価基準にするべきか ▪ 例えば売上予測の案件などでは、RMSEでモデル選択をすると大手企業の予測値が良いモデルが選ばれがちで、MAPEでモデル選択をすると小規模企業の予測値が良いモデルが選ばれがち ▪ 案件状況・ビジネス目的に沿った評価指標を考える必要がある

設計・レビューの向上／モデル案件の正しさ・全体設計への応用 • アンチパターンの理解 ◦ GBDT系 ▪ 学習率をチューニングパラメータにしない ▪ （初手から）欠損埋めをしない ▪
（初手から）特徴量の標準化をしない ▪ （初手から）外れ値の除去をしない ◦ validation構築・評価系 ▪ 時系列データをシャッフルしてtrain, validation分割しない ▪ holdoutをみながらチューニングしない ◦ その他 ▪ （設計上不適切な場合）IDを特徴量に含めない ▪ 本番推論時に使えない特徴量を使わない ▪ いきなり複雑なモデルから始めない

APPENDIX

セッションに関連した資料のご紹介 • セッションに関連した資料 ◦ Two-Towerモデルと近似最近傍探索による候補生成ロジックの導入 ▪ https://blog.recruit.co.jp/data/articles/two-tower-model/ ▪ https://speakerdeck.com/recruitengineers/techcon2025-naka ma-wakatsuki（※RECRUIT
TECH CONFERENCE 2025の資料） ◦ 【解法紹介】RecSys Challenge 2025 で優勝しました ▪ https://blog.recruit.co.jp/data/articles/recsys-challenge-2025/ ◦ atmaCup#16 in collaboration with RECRUIT 開催の裏側 ▪ https://blog.recruit.co.jp/data/articles/atmacup_2023/ ※2025年4月より「HR・人材」領域のサービスは Indeed Japan株式会社または株式会社インディードリクルートパートナーズが提供しております。

Kaggleで鍛えたスキルの実務での活かし方　競技とプロダクト開発のリアル

Kaggleで鍛えたスキルの実務での活かし方　競技とプロダクト開発のリアル

Recruit PRO

More Decks by Recruit

Other Decks in Technology

Featured

Transcript

RECRUIT TECH CONFERENCE 2026 Kaggleで鍛えたスキルの実務での活かし方競技とプロダクト開発のリアル阿内宏武　羽鳥冬星　中間康文

Agenda 1. 自己紹介 2. トピック１「Kaggle関連実績紹介」 a. 個人の実績紹介 b. 会社の実績紹介 3.

Agenda 1. 自己紹介 2. トピック１「Kaggle関連実績紹介」 a. 個人の実績紹介 b. 会社の実績紹介 3.

阿内宏武オセロ / ギター経歴 / Career 2016年にリクルートに新卒入社。 2021年までDSとして『ゼクシィ』・『カーセン

羽鳥冬星ストリートファイター6、Kaggle 経歴 / Career 2015年にリクルートに新卒入社。シニアデータサイエンティスト DSとしてHR領域を中心として複数の領域のレコメンドモデルの改善に取り組む

中間康文アニメ・漫画・ゲーム・野球・釣り経歴 / Career 2021年にリクルートに新卒入社。 DSとして、HR領域の各プロダクトにおけるレコメンドシステムの改善に取り組む。 Two-Towerモデルと近似最近傍探索による候補

Agenda 1. 自己紹介 2. トピック１「Kaggle関連実績紹介」 a. 個人の実績紹介 b. 会社の実績紹介 3.

阿内の実績紹介 RecSys Challenge 2025 1st 出典：Kaggle（https://www.kaggle.com/kannahashimoto）

羽鳥の実績紹介出典：Kaggle（https://www.kaggle.com/toseihatori）

中間の実績紹介出典：Kaggle（https://www.kaggle.com/yasufuminakama）

Agenda 1. 自己紹介 2. トピック１「Kaggle関連実績紹介」 a. 個人の実績紹介 b. 会社の実績紹介 3.

リクルートのKaggler事情 2名 12名〜 10名〜在籍しているKaggler

リクルートのKaggler事情直近実績・LLM 20 Questions　11th🏆 ・ISIC 2024 - Skin Cancer

リクルートのデータコンペ開催実績・クーポン購入予測コンペ(10年前) ・レストランの来店予約コンペ(8年前) ・宿/ホテルの推薦コンペ(2年前)

Agenda 1. 自己紹介 2. トピック１「Kaggle関連実績紹介」 a. 個人の実績紹介 b. 会社の実績紹介 3.

コンペを始めたきっかけ • 阿内 ◦ ふと、外部に自分の実績を示せることがないことに気づいたため • 羽鳥 ◦ 当時開催されていたTalking Dataというコンペが業務でやっている内容

Agenda 1. 自己紹介 2. トピック１「Kaggle関連実績紹介」 a. 個人の実績紹介 b. 会社の実績紹介 3.

思い出に残るハプニングや修羅場、印象的な出来事 • 阿内 ◦ ラストsubmissionの選択を朝やろうと言っていたのにリーダーが起きない ◦ 初参加ではしっかりPublic激強notebookを何も考えずにコピペして痛い目に会う •

Agenda 1. 自己紹介 2. トピック１「Kaggle関連実績紹介」 a. 個人の実績紹介 b. 会社の実績紹介 3.

Two-Towerモデルの導入 • ルールベースの候補生成をTwo-Towerモデルに置き換えた • 計算効率の改善と候補生成の精度の改善どちらも狙う 1st-stage 求職者求人票候補生成ルールベースフィルター

Two-Towerモデル Embedding Encoder Feature • ニューラルネットワークで求職者と求人票をベクトル化 • それぞれ同じ空間に埋め込むことで、類似度を計算できる求職者求人票

近似最近傍探索求人票求職者 IT系 IT系に興味近似最近傍探索 • 近似最近傍探索により各求職者に近い求人票を指定件数だけ高速に取得可能 Encoder Feature

Two-Towerモデルと近似最近傍探索による候補生成 • 計算効率の改善 ◦ 求職者と求人票をTwo-Towerモデルでembeddingに変換 ◦ 近似最近傍探索により、各求職者に近い求人票を指定件数だけ取得 ◦ 計算量をコントロールできる •

Kaggleの学びがどう活きたか？ • Kaggleで培われるのは手の速さと手数の多さ ◦ 手の速さ ▪ ベースライン作成 • Notebooks Grandmasterなので慣れている＆基本的なコードは流用できる

オフライン検証 1st-stageの候補生成の精度はRecallで評価 1. 学習データと評価データを用意 a. 行動が発生した求職者×求人票ペアのリスト b. 学習/評価は時系列の前後で分割 2. 学習データを使ってTwo-Towerモデルを学習

成果 • 推論 ◦ レコメンド対象の増加に対応 ◦ 1st-stageのフィルター部分が約25倍高速化 ◦ 推論全体で約2倍高速化 •

Agenda 1. 自己紹介 2. トピック１「Kaggle関連実績紹介」 a. 個人の実績紹介 b. 会社の実績紹介 3.

設計・レビューの向上／モデル案件の正しさ・全体設計への応用 • アンチパターンの理解 ◦ GBDT系 ▪ 学習率をチューニングパラメータにしない ▪ （初手から）欠損埋めをしない ▪

APPENDIX

Kaggleで鍛えたスキルの実務での活かし方 競技とプロダクト開発のリアル

Kaggleで鍛えたスキルの実務での活かし方 競技とプロダクト開発のリアル

More Decks by Recruit

Other Decks in Technology

Featured

Transcript

Kaggleで鍛えたスキルの実務での活かし方　競技とプロダクト開発のリアル

Kaggleで鍛えたスキルの実務での活かし方　競技とプロダクト開発のリアル