Upgrade to Pro — share decks privately, control downloads, hide ads and more …

転職希望者と求人のマッチングモデル開発について ~これまでと今後の展望~

転職希望者と求人のマッチングモデル開発について ~これまでと今後の展望~

「実サービスの中で本当に価値を生み出す機械学習モデルとは、どのように開発・運用されているのか?」をテーマに、転職希望者様と求人とのマッチングを目的とする推薦モデルの開発について、これまでと今後の展望をご紹介します。

Avatar for PERSOL CAREER Dev | techtekt

PERSOL CAREER Dev | techtekt PRO

September 04, 2025
Tweet

More Decks by PERSOL CAREER Dev | techtekt

Other Decks in Technology

Transcript

  1. © PERSOL CAREER CO., LTD. All Rights Reserved. 3 浦山

    昌生 Masao urayama パーソルキャリア株式会社 データ・AIソリューション本部 データソリューション統括部 データサイエンス部 プロダクトサイエンスグループ シニアデータアナリスト AI ベンダーでデータサイエンティスト兼PL(プロジェクトリー ダー)として機械学習モデルの開発やデータ分析の受託業務に従事。 それまでは、ネットワークエンジニア、情報セキュリティエンジニ アとして顧客の課題解決に対応。2021年10月にパーソルキャリア に入社し、推薦モデルの開発、情報検索システムの開発等、先進的 なデータの活用を実践。
  2. © PERSOL CAREER CO., LTD. All Rights Reserved. 自己紹介:データサイエンス関連の仕事 4

    テーマ 実施概要 自動推薦システム 転職希望者様向けの自動案件紹介サービスの改善、モデル開発、データ分析 「doda」サイト 検索&推薦改善 ベクトル検索を利用した検索システムの改善。検索文字列に対する求人の推薦。 ベクトル検索推進 ベクトル検索技術を用いて、求人情報等の検索や推薦する方法を検証し提案 生成 AI LLM 検証 生成 AI や LLM について技術検証を行い、有用な技術応用を模索する取り組み 設備故障検知 発電設備の各種センサーデータを利用して、故障を検知するモデルを開発、精度を評価 需要予測 顧客の業務課題に合う予測モデルを開発し、精度を評価
  3. © PERSOL CAREER CO., LTD. All Rights Reserved. 会社概要 6

    社 名 本 社 創 業 資 本 金 事 業 内 容 従 業 員 数 パーソルキャリア株式会社 東京都港区 1989年6月 1,127百万円 人材紹介サービス、求人メディアの運営、転職・就職支援、 採用・経営支援、副業・兼業・フリーランス支援サービスの提供 7,048名 (有期社員含む グループ会社出向中の者は除く 2025年3月1日時点)
  4. © PERSOL CAREER CO., LTD. All Rights Reserved. 9 01

    はじめに 02 これまで 03 これから 04 まとめ
  5. © PERSOL CAREER CO., LTD. All Rights Reserved. はじめに:求人、求職、求人倍率の推移(ハローワーク) 11

    出典) 一般職業紹介状況(令和7年5月分)について(厚生労働省) https://www.mhlw.go.jp/stf/newpage_59035.html
  6. © PERSOL CAREER CO., LTD. All Rights Reserved. はじめに:「doda」転職求人倍率レポート 12

    出典) 転職求人倍率レポート(2025年6月) https://doda.jp/guide/kyujin_bairitsu/
  7. © PERSOL CAREER CO., LTD. All Rights Reserved. はじめに:背景とニーズ •

    背景 • 「doda」会員登録者数 約 988 万人(2025 年 6 月、累計) • 「doda」Web サイトの公開求人数 約 25 万件(2025 年 8 月) • 転職希望者様のご意向に合う求人をご紹介 • 転職希望者様ご自身が検索 → モバイルアプリ、Webサイトで検索 • キャリアアドバイザーが手動で検索 → 基幹システムで検索 • 機械学習モデルがバッチ処理で検索 → 毎日 1 ~ 2 桁億組を計算 • ニーズ • 膨大な組み合わせの中から • 最適な組み合わせを見つけ出し • 素早くお客様にお届けする 13 出典) 転職求人倍率レポート(2025年6月) https://doda.jp/guide/kyujin_bairitsu/ 出典) 転職サービス「doda」Web サイト https://doda.jp/
  8. © PERSOL CAREER CO., LTD. All Rights Reserved. はじめに:取り組みの例 •

    UX 改善 • 専門部署の立ち上げと推進 • 「doda」サイトやアプリの改善 • 職務経歴書の自動作成 • 新しいサービスの提供 • HR forecaster • サービス品質の向上、業務効率化 • 省力化 • 社内用 AI チャットボット導入 • プロセス改善 • 基幹システム改善 • 自動化 • 推薦システムの改善 14 出典) パーソルキャリア ニュースリリース:職務経歴書が最短“1分”で作成できる https://www.persol-career.co.jp/newsroom/news/service/2024/20240424_1441/
  9. © PERSOL CAREER CO., LTD. All Rights Reserved. はじめに:推薦モデルの改善の「これまで」と「これから」 •

    大規模言語モデルを推薦モデルにも応用(← 本日の結論) 15 これまでの推薦モデル これからの推薦モデル データセットのみから学習する 「教師あり学習」がメイン 事前学習済み大規模言語モデルの ファインチューニングモデルを開発&評価 タスクに応じて個別のモデルを開発 「最強モデル」を開発して 知識蒸留を経て「蒸留モデル」を利用 強い事前学習済みオープンモデルが登場 もっと強いオープンモデルが登場
  10. © PERSOL CAREER CO., LTD. All Rights Reserved. これまで:推薦システムとは? •

    マッチング • 転職希望者様のご希望、ご経験、スキルセットなどと、企業様側が求める条件とを比較し、 双方の条件が一致することを確認。双方のご要望を満たすことを目的とする。 • ニーズや条件を照らし合わせ、最適な組み合わせを見つけるプロセス。 • 推薦 • 転職希望者様のご希望、ご経験、スキルセットなど基づいて、適切な求人を選び出しご紹介 すること。(スカウトの場合は企業様向けに転職希望者様をご紹介) • 推薦システム • 自動または半自動で「推薦」するシステム。 • バッチ系、オンライン系に大別される。 • 内部に推薦モデルを持つ。 17 出典)Hidden Technical Debt in Machine Learning Systems(2015年)
  11. © PERSOL CAREER CO., LTD. All Rights Reserved. これまで:サービスと推薦システム 18

    出典) 「doda」サービスイメージ https://www.saiyo-doda.jp/service
  12. © PERSOL CAREER CO., LTD. All Rights Reserved. これまで:転職希望者様向け推薦システムの開発事例 •

    アーキテクチャ • 基幹システム • 機能:社内向け UI、データ管理、メール配信 • 推薦システム コンピューティング環境 • 機能:データ連携、ETL 処理、特徴量作成、推薦モデル実行 • 推薦モデル開発 • 教師データ • 転職希望者様と求人の属性情報。応募実績、書類選考の通過実績等。 • コンピューティング • マネージド Apach Spark クラスタ(合計メモリ 2TB) • アルゴリズム • RandomForest、主成分分析、ロジスティック回帰等 • 性能評価 • 精度評価、処理速度評価 • 特性評価(ビジネス要件の対応など) 19
  13. © PERSOL CAREER CO., LTD. All Rights Reserved. これまで:推薦モデルの例 •

    推薦度合いを推定するためのパイプライン • 複数のモデルをアンサンブル 20
  14. © PERSOL CAREER CO., LTD. All Rights Reserved. これまで:精度評価イメージ •

    複数のモデルを開発して精度や性能を評価 • 美味しいところを探索 21
  15. © PERSOL CAREER CO., LTD. All Rights Reserved. これまで:ハイパーパラメーターと精度のイメージ •

    ハイパーパラメーターの探索イメージ • 計算機リソースの制約 → 計算できないポイントも 23
  16. © PERSOL CAREER CO., LTD. All Rights Reserved. 機械学習モデル開発 •

    プロセスの定義と改善の取り組み 24 工程と実施事項 モデル開発の管理ポイント 推奨ツール
  17. © PERSOL CAREER CO., LTD. All Rights Reserved. 機械学習モデル開発:工程と実施事項 25

    工程 PJT 実施事項 モデル開発者 実施事項 企画 分析要件定義、EDA •分析環境構築 •データ取得 •データ確認(可視化等) モデル開発、分析 •ベースラインモデル開発 •精度評価ソフトウェア開発 •モデル開発 精度評価 レポーティング 情報共有方法の定義 関係者で合意 企画資料を作成 レポジトリ作成 スタブコード作成 環境構築 EDA(探索的データ分析) 実施 分析設計 実験管理環境を構築(MLflow) 開発ワークフロー構築 (Linter、make、DVC) 分析設計を共有 精度評価コードの開発 モデル開発(データ分析)を実施 精度評価 レポート作成 (実施事項、精度) 関係者へ報告 バグ対応
  18. © PERSOL CAREER CO., LTD. All Rights Reserved. 機械学習モデル開発:モデル開発の管理ポイント 26

    性能 品質 コスト 予測精度 汎化性能 処理速度 再現性 バグ含有量 モデル開発 • 良質なデータ • 良い前処理 • 良いモデル • 要件に合った精度評価 • 交差検証 • データ分割 • コードバージョン管理 • 実験ログ管理の自動化 • 適度な構造化 • データと実行環境の明確化 • フォーマッタ利用 • フォルダーテンプレートの利用 • 様々なテクニック • 開発工数、計算機資源 システム実装 • 引継ぎ工数、開発工数、計算機資源
  19. © PERSOL CAREER CO., LTD. All Rights Reserved. 機械学習モデル開発︓推奨ツール 27

    # 目的 内容 ツール例 1 コードの再現性を確保 バージョン管理 git 2 コードの再現性を確保 リリースバージョンを管理 リポジトリ管理、チケット管理、Wiki GitLab、GitHub 等 3 コードの可読性向上 実行前のコードのバグ検知 自動コード整形、静的解析 ※ 未定義変数の参照などの単純なバグを減らす。 可読性を上げ、メンテナンスコストを下げる。 Ruff 4 実験の再現性を確保 実験記録の保持 実験管理の自動化 ※ 実行時オプション、実行結果を自動的に記録。 MLflow 5 コードの品質向上 フォルダ構成の標準化 ディレクトリ構造のテンプレート ※ 可読性を上げ、メンテナンスコストを下げる。 Cookiecutter Data Science 6 ソフトウェア構成管理 利用ライブラリや依存ライブラリを再現 uv 7 データの再現性を確保 実行の再現性を確保 パイプライン定義、データバージョン管理 ※いつでも任意の時点のデータに復元する DVC
  20. © PERSOL CAREER CO., LTD. All Rights Reserved. これから:大規模言語モデルのパラダイムシフト •

    Attention is All You Need(2017年) • Transformer を提案 • 「必要なのは Attention だけ」 • パラダイムシフト • 系列データの分散学習 • 大規模な計算リソースの投入 • 学習データとパラメータ数の増加 29 出典) Attention Is All You Need(2017) https://arxiv.org/html/1706.03762v7 Transformer のモデル構造
  21. © PERSOL CAREER CO., LTD. All Rights Reserved. これから:パラダイムシフト後のトレンド •

    スケーリング則と呼ばれるモデルの性能向上に関する法則 • 計算量:沢山 GPU を使うと増やせる • データセットの大きさ:学習したテキストが多いと増やせる • モデルのパラメーター数:モデルのパラメーター数 30 出典) Scaling Laws for Neural Language Models(2020) https://ar5iv.labs.arxiv.org/html/2001.08361
  22. © PERSOL CAREER CO., LTD. All Rights Reserved. これから:パラダイムシフト後の計算量とコスト感 •

    計算量と費用 31 出典) Language Models are Few-Shot Learners(2020) https://ar5iv.labs.arxiv.org/html/2005.14165 出典) NVIDIA A100 TENSOR CORE GPU https://www.nvidia.com/ja-jp/data-center/a100/ NVIDIA Tesla A100 の特性 計算量:0.3 PFLOPS/枚(BFLOAT16) インスタンス単価:15,000円/日 → 換算金額:1.0 PetaFLOP/s-days = 5.0 万円 GPT-3、Params 175B、5 億円
  23. © PERSOL CAREER CO., LTD. All Rights Reserved. これから:大規模言語モデルのリリース状況 •

    立て続けにリリースされる「最強モデル」 32 出典)A Survey of Large Language Models https://ar5iv.org/pdf/2303.18223
  24. © PERSOL CAREER CO., LTD. All Rights Reserved. これから:大規模言語モデルの系統分類 •

    開発競争の中心 → デコーダーモデルへ 33 出典)Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond https://ar5iv.labs.arxiv.org/html/2304.13712
  25. © PERSOL CAREER CO., LTD. All Rights Reserved. これから︓大規模言語モデルの特徴 •

    知ってること︓公開されているデジタル情報から学べる事 • 言語知識 • 一般知識(科学、数学、歴史、地理)、実用知識(料理、旅行) • 文化知識(文学、芸術、社会)、専門知識、時事問題 • 知らないこと︓公開されているデジタル情報から学べない事 • 個人情報、ユーザー生成コンテンツ • 組織の機密情報 • 最新のニュース • 非デジタル情報 34
  26. © PERSOL CAREER CO., LTD. All Rights Reserved. これから:推薦システムに対する大規模言語モデル(LLM)の応用例 •

    LLM のモデリング方法 1. LLM Embedding + RS • テキスト埋め込みモデル • 推薦モデルは分類モデル等 2. LLM Tokens + RS • LLM を相性の推定モデルとして利用 • 推薦モデルは系列分類モデル等 3. LLM as RS • LLM を回答の生成に利用 ※ RS: 推薦システム 35 出典) A Survey on Large Language Models for Recommendation(2025) https://ar5iv.labs.arxiv.org/html/2305.19860
  27. © PERSOL CAREER CO., LTD. All Rights Reserved. これから︓大規模言語モデルを推薦モデルとして利用 •

    レガシーな機械学習モデルと比較すると︖ 36 評価項目 開発時 運用時 品質 高精度 高精度 費用 計算量増加 GPU 利用、分散処理、試行錯誤 計算量増加 GPU 利用、分散処理 デリバリー 延長 学習処理時間、試行錯誤 延長 アップデート対応
  28. © PERSOL CAREER CO., LTD. All Rights Reserved. • 計算量の削減

    • マルチステージ推薦システム • Retreaver • Bi-Encoder モデル(Two-Tower モデル等) • Reranker • 分類モデル、Cross-Encode モデル • モデル開発の効率化 • 知識蒸留(Knowledge Distillation) • オリジナルモデル • LLM を利用した高精度&低速モデル • 人、モノ、金を投入して開発 • 蒸留モデル • オリジナルモデルの知識蒸留版モデル • 用途に応じて精度と速度のトレードオフ これから:計算量とモデル開発の効率化が課題 37 出典) A Survey on Knowledge Distillation of Large Language Models(2024) https://arxiv.org/html/2402.13116v4 User Attribute Item Attribute Retreaver Reranker Items
  29. © PERSOL CAREER CO., LTD. All Rights Reserved. まとめ パーソルキャリアのミッション/バリュー

    人々に「はたらく」を自分のものにする力を 39 これまでの推薦モデル これからの推薦モデル データセットのみから学習する 「教師あり学習」がメイン 事前学習済み大規模言語モデルの ファインチューニングモデルを開発&評価 タスクに応じて個別のモデルを開発 「最強モデル」を開発して 知識蒸留を経て「蒸留モデル」を利用 強い事前学習済みオープンモデルが登場 もっと強いオープンモデルが登場
  30. © PERSOL CAREER CO., LTD. All Rights Reserved. パーソルキャリア データ・AIソリューション本部の紹介

    • キャリアのバラエティが豊富(博士、研究者、大学講師など様々な経歴) • 約 150 名(業務委託含む) • エンジニア 8 割、データサイエンティスト 2 割 • 新卒メンバーも活躍してます︕︕ 41 データと AI で顧客の課題を解決し、業務効率化とビジネス価値の最大化を図る (生成 AI、LLM、機械学習等の最新技術をビジネス応用させることをミッションとする部門) • データ/ AI を高次元で活用し、事業拡大・顧客基盤拡大を実現する。 • 最新テクノロジーでセキュアな分析基盤や AI 基盤を拡張・進化させる。 • データ品質管理や AI モデルの精度向上を継続的に行い、高いレベルのガバナンスを確立する。 ① 分析・AI 基盤の拡張/ 高度化 ② データ・AI 利活用の推進 • データと AI 技術を効果的に活用し、全事業/プロダクトにおいて最適な意思決定を支援する • データ利活用により業務効率化と顧客体験の向上を図る • データ分析を通じて競争力を強化し、新たなビジネスチャンスを創出するための取り組みを推進する ミッション メンバー ※2025年8月時点
  31. © PERSOL CAREER CO., LTD. All Rights Reserved. エンジニアブログのご紹介 42

    さまざまなテーマで事例や知見を学ぶ IT・テクノロジー人材のための勉強会コミュニティ 「TECH Street」当社の事例を公開しています。 「techtekt(テックテクト)」は、 パーソルキャリアのエンジニアブログです。 “みんなの「はたらく」をテックでつくる”をコンセプトに、 技術、組織、学びなど、さまざまな情報を発信しています。