Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Recruit
PRO
February 27, 2026
Technology
530
1
Share
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
2026/2/27に、RECRUIT TECH CONFERENCE 2026で発表した三田の資料になります。
Recruit
PRO
February 27, 2026
More Decks by Recruit
See All by Recruit
ストリーム処理基盤のFlink移行検証と適材適所の実践
recruitengineers
PRO
2
51
AI 時代の Platform Engineering
recruitengineers
PRO
2
370
巨大プラットフォームを進化させる「第3のROI」
recruitengineers
PRO
2
3.2k
データ戦略を加速させる プラットフォーム エンジニアリングと進化的アーキテクチャ
recruitengineers
PRO
2
83
まなび領域における生成AI活用事例
recruitengineers
PRO
2
290
AI時代にエンジニアはどう成長すれば良いのか?
recruitengineers
PRO
1
520
AIを用いたカスタマーサポートの業務プロセス・組織変革の実現
recruitengineers
PRO
1
230
問い合わせ自動化の技術的挑戦
recruitengineers
PRO
2
350
「Air ビジネスツールズ」のクライアントサポートにおける生成 AI 活用
recruitengineers
PRO
0
170
Other Decks in Technology
See All in Technology
ITエンジニアを取り巻く環境とキャリアパス / A career path for Japanese IT engineers
takatama
4
1.8k
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.8k
ルールやカスタム機能、どう使う?理想の出力を引き出すために今知りたいIBM Bob 5つの機能
muehara
1
330
Agentic ERPをどう設計するか ー 受発注エージェントを動かす、現場の知見と設計思想ー
recerqainc
1
1.5k
AI と創る新たな世界 / A New World Created with AI
ks91
PRO
0
110
サイバーセキュリティ概論 / Introduction to Cybersecurity
ks91
PRO
0
150
生成 AI × MCP で切り拓く次世代 SRE!自律型運用への挑戦と開発者体験の進化
_awache
0
150
ポケモンの型をTypeScriptの型システムで表現してみた
subroh0508
0
320
JJUG CCC 2026 Spring AI時代の開発こそ標準化を武器に! ― 方式・プロセス・プラットフォームの標準化
s27watanabe
2
720
そのPoC、何を検証したつもりでしたか? AIプロダクトの価値検証で陥った落とし穴
techtekt
PRO
0
150
価格.comをAI駆動で全面刷新する ー 30年分の技術的負債を返し、次の30年の土台をつくる ー / AI Engineering Summit Tokyo 2026
tkyowa
49
52k
[モダンアプリ勉強会]今更聞けないGit/GitHub入門
tsukuboshi
0
260
Featured
See All Featured
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
200
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
56k
A Soul's Torment
seathinner
6
2.9k
The SEO Collaboration Effect
kristinabergwall1
1
480
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
280
The Limits of Empathy - UXLibs8
cassininazir
1
350
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
860
Technical Leadership for Architectural Decision Making
baasie
3
400
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
190
Transcript
RECRUIT TECH CONFERENCE 2026 LLM活用の本質:「作る視点」と「使う視点」 LLM活用の壁を超える: リクルートR&Dの戦略と打ち手 データ推進室 三田 雅人
三田 雅人 料理・テニス・ゲーム 経歴 / Career 理化学研究所、CyberAgent AI Labの研究者を経て、 2025年にリクルートにキャリア採用入社。
専門は、自然言語処理、計算心理言語学。 R&D組織にてLLMのプロダクト実装を推進。 2025年言語処理学会年次大会にて最優秀賞受賞。 趣味 / Hobbies プロダクト開発 データ推進室 データテクノロジーラボ部 R&Dグループ 2
リクルートにおけるR&D体制 - WhaleLM - 限られたLLM専門リソースを集中し、R&Dから事業実装のできるチームを育成、 全社レベルの事業優先度の高い中長期プロジェクトにアサイン R-ICT GPT 既製LLMの事業活用 OpenAI(Azure)のGPTシリーズ
中心でプロダクト適用、 Prompt Engineeringがメイン WhaleLM PoC ~ 事業実装 DS/MLEが中心でより高度なモデリング が必要かつ事業クリティカルになりうる LLM活用を推進 3
LLM活⽤フェーズが進み、ニーズがシャープに⾼難易度に 4 • カーセンサー ◦ チャットではなく既存UXに組み込み ➔ システム性能要件(レイテンシ等)が高い ◦ 効果直結の打ち手が明確:
レコメンド再ランキング/レコメンド軸提案 • HR キャリアアシスタントAI ◦ LLMがコア機能 ◦ SLM置換でインパクト大:コスト最適化+UX向上 ※画像はイメージです
⾼度なLLM活⽤でインパクト創出するための⽅針 領域施策実行 共通機能 検証/開発 施策・機能の 横展開 R&D モジュール の切り出し 領域側で
モジュール適用 横展開 機能の高度化 高度化した機能を逆輸入 R&Dから施策化 5
LLM活用の壁 • 非機能要件への対応(レイテンシ/スループット/コスト) ◦ 既存UXに組み込むには応答速度と安定運用が必須(=品質とのトレードオフ) ◦ ➔ 小型化・高速化・運用設計で“必要十分な品質”を保ちながら最適化 • 出力の制御性・指示追従性(フォーマット遵守/一貫性)
◦ 期待通りの形式・粒度・制約で出させないと、後段処理やUIが壊れる (=自由度とのトレードオフ) ◦ ➔ 運用側の制約設計に加え、学習で指示追従性を底上げして、狙い通りの出力を安定化 6
非チャットUIにおける生成文表示 • 課題:LLMで品質の高い生成文は実現できるがレイテンシやコスト面で△ ◦ 例: Gemini-2.5-flashを用いて推薦文を生成 ▪ 想定リクエスト量(30RPS)を保証するためには約970万円/月*1 ▪ レイテンシ:
1380ms/件(5000ms/5件) • 打ち手:SLMおよび推論高速化技術の活用 ◦ 例:SFT・知識蒸留・投機的デコーディング...など ◦ ➔ 性能改善しつつ約17.5倍高速化&運用料金を98.5%削減 モデル 最低要件遵守率 (%) ↑ レイテンシ (ms) ↑ 月額 (¥) ↓ 実タスク GPU=10 GPU=3 gemini-2.5-flash 97.4 1380 N/A N/A 9,700,000 llm-jp-3-150m w/ 蒸留・推論高速化 99.4 79 258 472 145,800 7 *1. 入力トークン:700, クエリあたりの出力レスポンステキストトークン数:150 設定における見積もり(2026年2月時点)
知識蒸留における忠実性改善 • 課題:「ショートカット学習」 ◦ 生徒モデルが教師モデルの推論・出力形式を真似せず、独自フォーマット/冗長回答 に逃げる(=忠実性の低下) • 打ち手:Adaptive Z-score Weighting
(AZ-Weighting) を提案 ◦ 学習中の損失履歴から各サンプルのZ-scoreで難易度を動的に推定 ◦ 教師との乖離が大きい(ショートカットしがちな)サンプルに勾配重みを強めて教師 分布へ寄せる ➔ フォーマット追従性(strict-match)が改善 モデル flexible-extract strict-match GKD [Agarwal+24] 68.69 43.85 w/ AZ-Weighting 69.75 47.16 JSAI2026 発表予定 8 例: GSM8K
まとめ:LLMをプロダクトに“組み込む”ためのR&D • ミッション:LLM専門人材・知見を集約し、R&D〜事業装着を一気通貫で推進する体制を 構築し、全社優先度の高い中長期テーマに集中投下 • 壁① 非機能要件(レイテンシ/スループット/コスト) ◦ SLM+推論高速化で“必要十分な品質”を保ちながらレイテンシ・コスト最適化 •
壁② 制御性・指示追従性(形式遵守/一貫性) ◦ 知識蒸留における忠実性を向上させるための道具立てを研究開発 • R&Dの提供価値: ◦ 横断組織として横展開:成功パターンをモジュール化(学習・推論・評価)して 複数領域・プロダクトへ再利用 ◦ ゼロイチで技術を作る:既存技術では解消が難しいギャップに対しては、 研究アプローチにより新技術を創出して課題解決に向けた道具立てを整備 9