LLM活用の壁を超える：リクルートR&Dの戦略と打ち手

RECRUIT TECH CONFERENCE 2026 LLM活用の本質：「作る視点」と「使う視点」 LLM活用の壁を超える：リクルートR&Dの戦略と打ち手データ推進室三田雅人

三田雅人料理・テニス・ゲーム経歴 / Career 理化学研究所、CyberAgent AI Labの研究者を経て、 2025年にリクルートにキャリア採用入社。
専門は、自然言語処理、計算心理言語学。 R&D組織にてLLMのプロダクト実装を推進。 2025年言語処理学会年次大会にて最優秀賞受賞。趣味 / Hobbies プロダクト開発データ推進室データテクノロジーラボ部 R&Dグループ 2

リクルートにおけるR&D体制 - WhaleLM - 限られたLLM専門リソースを集中し、R&Dから事業実装のできるチームを育成、全社レベルの事業優先度の高い中長期プロジェクトにアサイン R-ICT GPT 既製LLMの事業活用 OpenAI(Azure)のGPTシリーズ
中心でプロダクト適用、 Prompt Engineeringがメイン WhaleLM PoC ~ 事業実装 DS/MLEが中心でより高度なモデリングが必要かつ事業クリティカルになりうる LLM活用を推進 3

LLM活⽤フェーズが進み、ニーズがシャープに⾼難易度に 4 • カーセンサー ◦ チャットではなく既存UXに組み込み ➔ システム性能要件（レイテンシ等）が高い ◦ 効果直結の打ち手が明確：
レコメンド再ランキング／レコメンド軸提案 • HR キャリアアシスタントAI ◦ LLMがコア機能 ◦ SLM置換でインパクト大：コスト最適化＋UX向上 ※画像はイメージです

⾼度なLLM活⽤でインパクト創出するための⽅針領域施策実行共通機能検証/開発施策・機能の横展開 R&D モジュールの切り出し領域側で
モジュール適用横展開機能の高度化高度化した機能を逆輸入 R&Dから施策化 5

LLM活用の壁 • 非機能要件への対応（レイテンシ/スループット/コスト） ◦ 既存UXに組み込むには応答速度と安定運用が必須（＝品質とのトレードオフ） ◦ ➔ 小型化・高速化・運用設計で“必要十分な品質”を保ちながら最適化 • 出力の制御性・指示追従性（フォーマット遵守/一貫性）
◦ 期待通りの形式・粒度・制約で出させないと、後段処理やUIが壊れる（＝自由度とのトレードオフ） ◦ ➔ 運用側の制約設計に加え、学習で指示追従性を底上げして、狙い通りの出力を安定化 6

非チャットUIにおける生成文表示 • 課題：LLMで品質の高い生成文は実現できるがレイテンシやコスト面で△ ◦ 例: Gemini-2.5-ﬂashを用いて推薦文を生成 ▪ 想定リクエスト量（30RPS）を保証するためには約970万円/月*1 ▪ レイテンシ:
1380ms/件（5000ms/5件） • 打ち手：SLMおよび推論高速化技術の活用 ◦ 例：SFT・知識蒸留・投機的デコーディング...など ◦ ➔ 性能改善しつつ約17.5倍高速化&運用料金を98.5%削減モデル最低要件遵守率 (%) ↑ レイテンシ (ms) ↑ 月額 (¥) ↓ 実タスク GPU=10 GPU=3 gemini-2.5-ﬂash 97.4 1380 N/A N/A 9,700,000 llm-jp-3-150m w/ 蒸留・推論高速化 99.4 79 258 472 145,800 7 *1. 入力トークン:700, クエリあたりの出力レスポンステキストトークン数:150 設定における見積もり（2026年2月時点）

知識蒸留における忠実性改善 • 課題：「ショートカット学習」 ◦ 生徒モデルが教師モデルの推論・出力形式を真似せず、独自フォーマット／冗長回答に逃げる（=忠実性の低下） • 打ち手：Adaptive Z-score Weighting
(AZ-Weighting) を提案 ◦ 学習中の損失履歴から各サンプルのZ-scoreで難易度を動的に推定 ◦ 教師との乖離が大きい（ショートカットしがちな）サンプルに勾配重みを強めて教師分布へ寄せる ➔ フォーマット追従性（strict-match）が改善モデル ﬂexible-extract strict-match GKD [Agarwal+24] 68.69 43.85 w/ AZ-Weighting 69.75 47.16 JSAI2026 発表予定 8 例: GSM8K

まとめ：LLMをプロダクトに“組み込む”ためのR&D • ミッション：LLM専門人材・知見を集約し、R&D〜事業装着を一気通貫で推進する体制を構築し、全社優先度の高い中長期テーマに集中投下 • 壁① 非機能要件（レイテンシ／スループット／コスト） ◦ SLM＋推論高速化で“必要十分な品質”を保ちながらレイテンシ・コスト最適化 •
壁② 制御性・指示追従性（形式遵守／一貫性） ◦ 知識蒸留における忠実性を向上させるための道具立てを研究開発 • R&Dの提供価値： ◦ 横断組織として横展開：成功パターンをモジュール化（学習・推論・評価）して複数領域・プロダクトへ再利用 ◦ ゼロイチで技術を作る：既存技術では解消が難しいギャップに対しては、研究アプローチにより新技術を創出して課題解決に向けた道具立てを整備 9

LLM活用の壁を超える：リクルートR&Dの戦略と打ち手

LLM活用の壁を超える：リクルートR&Dの戦略と打ち手

Recruit PRO

More Decks by Recruit

Other Decks in Technology

Featured

Transcript

RECRUIT TECH CONFERENCE 2026 LLM活用の本質：「作る視点」と「使う視点」 LLM活用の壁を超える：リクルートR&Dの戦略と打ち手データ推進室三田雅人

三田雅人料理・テニス・ゲーム経歴 / Career 理化学研究所、CyberAgent AI Labの研究者を経て、 2025年にリクルートにキャリア採用入社。

LLM活⽤フェーズが進み、ニーズがシャープに⾼難易度に 4 • カーセンサー ◦ チャットではなく既存UXに組み込み ➔ システム性能要件（レイテンシ等）が高い ◦ 効果直結の打ち手が明確：

⾼度なLLM活⽤でインパクト創出するための⽅針領域施策実行共通機能検証/開発施策・機能の横展開 R&D モジュールの切り出し領域側で

知識蒸留における忠実性改善 • 課題：「ショートカット学習」 ◦ 生徒モデルが教師モデルの推論・出力形式を真似せず、独自フォーマット／冗長回答に逃げる（=忠実性の低下） • 打ち手：Adaptive Z-score Weighting