Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
Search
Recruit
PRO
February 27, 2026
Technology
560
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
2026/2/27に、RECRUIT TECH CONFERENCE 2026で発表した三田の資料になります。
Recruit
PRO
February 27, 2026
More Decks by Recruit
See All by Recruit
双方向推薦システムにおける長期的マッチング最大化に向けた代理目的関数の設計と実証
recruitengineers
PRO
0
79
就職⽀援サービスにおけるキャリアアドバイザーのシフトスケジューリング
recruitengineers
PRO
1
160
Model Routerを使った逐次LLM選択による毀損低減効果の検証
recruitengineers
PRO
1
49
ストリーム処理基盤のFlink移行検証と適材適所の実践
recruitengineers
PRO
2
78
AI 時代の Platform Engineering
recruitengineers
PRO
2
430
巨大プラットフォームを進化させる「第3のROI」
recruitengineers
PRO
2
3.4k
データ戦略を加速させる プラットフォーム エンジニアリングと進化的アーキテクチャ
recruitengineers
PRO
2
100
まなび領域における生成AI活用事例
recruitengineers
PRO
2
310
AI時代にエンジニアはどう成長すれば良いのか?
recruitengineers
PRO
1
550
Other Decks in Technology
See All in Technology
2026 AI Memory Architecture
nagatsu
0
580
AIAU_UMEMOGU_ninomiya_slide
ninomiya_ii
0
280
トークン最適化のためのユーザーストーリー分析 / User Story Analysis for Token Optimization
oomatomo
0
130
水を運ぶ人としてのリーダーシップ
izumii19
4
1.1k
40代で“やっとエンジニアになれた”――閉じた学びを開き、空の青さを知る / 20260628 Naoki Takahashi
shift_evolve
PRO
4
1.1k
自作お家AIエージェントスタックチャンFWで困っている所紹介
74th
0
130
FPGAの開発コンペでZephyrを使ってみた
iotengineer22
0
220
#エンジニアBooks 30分でわかる 「技術記事を書く技術」 / engineer-books 2026-06-30
jnchito
1
130
5分でわかる Amazon Connect_20260608
hwangbyeonghun
0
130
Hatena Engineer Seminar 37 jj1uzh
jj1uzh
0
150
AWS Summit の片隅で、体育座りしながらコミュニティがにぎわう理由を考えた
k_adachi_01
2
230
AIチャットの改善から見えた、良いAI体験とは / What Constitutes a Good AI Experience: Insights from Improving AI Chat
kubode
0
130
Featured
See All Featured
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
350
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
280
WENDY [Excerpt]
tessaabrams
11
38k
Odyssey Design
rkendrick25
PRO
2
710
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
75k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.6k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
2
580
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
340
The Pragmatic Product Professional
lauravandoore
37
7.3k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
AI: The stuff that nobody shows you
jnunemaker
PRO
8
740
Transcript
RECRUIT TECH CONFERENCE 2026 LLM活用の本質:「作る視点」と「使う視点」 LLM活用の壁を超える: リクルートR&Dの戦略と打ち手 データ推進室 三田 雅人
三田 雅人 料理・テニス・ゲーム 経歴 / Career 理化学研究所、CyberAgent AI Labの研究者を経て、 2025年にリクルートにキャリア採用入社。
専門は、自然言語処理、計算心理言語学。 R&D組織にてLLMのプロダクト実装を推進。 2025年言語処理学会年次大会にて最優秀賞受賞。 趣味 / Hobbies プロダクト開発 データ推進室 データテクノロジーラボ部 R&Dグループ 2
リクルートにおけるR&D体制 - WhaleLM - 限られたLLM専門リソースを集中し、R&Dから事業実装のできるチームを育成、 全社レベルの事業優先度の高い中長期プロジェクトにアサイン R-ICT GPT 既製LLMの事業活用 OpenAI(Azure)のGPTシリーズ
中心でプロダクト適用、 Prompt Engineeringがメイン WhaleLM PoC ~ 事業実装 DS/MLEが中心でより高度なモデリング が必要かつ事業クリティカルになりうる LLM活用を推進 3
LLM活⽤フェーズが進み、ニーズがシャープに⾼難易度に 4 • カーセンサー ◦ チャットではなく既存UXに組み込み ➔ システム性能要件(レイテンシ等)が高い ◦ 効果直結の打ち手が明確:
レコメンド再ランキング/レコメンド軸提案 • HR キャリアアシスタントAI ◦ LLMがコア機能 ◦ SLM置換でインパクト大:コスト最適化+UX向上 ※画像はイメージです
⾼度なLLM活⽤でインパクト創出するための⽅針 領域施策実行 共通機能 検証/開発 施策・機能の 横展開 R&D モジュール の切り出し 領域側で
モジュール適用 横展開 機能の高度化 高度化した機能を逆輸入 R&Dから施策化 5
LLM活用の壁 • 非機能要件への対応(レイテンシ/スループット/コスト) ◦ 既存UXに組み込むには応答速度と安定運用が必須(=品質とのトレードオフ) ◦ ➔ 小型化・高速化・運用設計で“必要十分な品質”を保ちながら最適化 • 出力の制御性・指示追従性(フォーマット遵守/一貫性)
◦ 期待通りの形式・粒度・制約で出させないと、後段処理やUIが壊れる (=自由度とのトレードオフ) ◦ ➔ 運用側の制約設計に加え、学習で指示追従性を底上げして、狙い通りの出力を安定化 6
非チャットUIにおける生成文表示 • 課題:LLMで品質の高い生成文は実現できるがレイテンシやコスト面で△ ◦ 例: Gemini-2.5-flashを用いて推薦文を生成 ▪ 想定リクエスト量(30RPS)を保証するためには約970万円/月*1 ▪ レイテンシ:
1380ms/件(5000ms/5件) • 打ち手:SLMおよび推論高速化技術の活用 ◦ 例:SFT・知識蒸留・投機的デコーディング...など ◦ ➔ 性能改善しつつ約17.5倍高速化&運用料金を98.5%削減 モデル 最低要件遵守率 (%) ↑ レイテンシ (ms) ↑ 月額 (¥) ↓ 実タスク GPU=10 GPU=3 gemini-2.5-flash 97.4 1380 N/A N/A 9,700,000 llm-jp-3-150m w/ 蒸留・推論高速化 99.4 79 258 472 145,800 7 *1. 入力トークン:700, クエリあたりの出力レスポンステキストトークン数:150 設定における見積もり(2026年2月時点)
知識蒸留における忠実性改善 • 課題:「ショートカット学習」 ◦ 生徒モデルが教師モデルの推論・出力形式を真似せず、独自フォーマット/冗長回答 に逃げる(=忠実性の低下) • 打ち手:Adaptive Z-score Weighting
(AZ-Weighting) を提案 ◦ 学習中の損失履歴から各サンプルのZ-scoreで難易度を動的に推定 ◦ 教師との乖離が大きい(ショートカットしがちな)サンプルに勾配重みを強めて教師 分布へ寄せる ➔ フォーマット追従性(strict-match)が改善 モデル flexible-extract strict-match GKD [Agarwal+24] 68.69 43.85 w/ AZ-Weighting 69.75 47.16 JSAI2026 発表予定 8 例: GSM8K
まとめ:LLMをプロダクトに“組み込む”ためのR&D • ミッション:LLM専門人材・知見を集約し、R&D〜事業装着を一気通貫で推進する体制を 構築し、全社優先度の高い中長期テーマに集中投下 • 壁① 非機能要件(レイテンシ/スループット/コスト) ◦ SLM+推論高速化で“必要十分な品質”を保ちながらレイテンシ・コスト最適化 •
壁② 制御性・指示追従性(形式遵守/一貫性) ◦ 知識蒸留における忠実性を向上させるための道具立てを研究開発 • R&Dの提供価値: ◦ 横断組織として横展開:成功パターンをモジュール化(学習・推論・評価)して 複数領域・プロダクトへ再利用 ◦ ゼロイチで技術を作る:既存技術では解消が難しいギャップに対しては、 研究アプローチにより新技術を創出して課題解決に向けた道具立てを整備 9