Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Recruit
PRO
February 27, 2026
Technology
1
280
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
2026/2/27に、RECRUIT TECH CONFERENCE 2026で発表した三田の資料になります。
Recruit
PRO
February 27, 2026
Tweet
Share
More Decks by Recruit
See All by Recruit
まなび領域における生成AI活用事例
recruitengineers
PRO
2
110
AI時代にエンジニアはどう成長すれば良いのか?
recruitengineers
PRO
1
160
AIを用いたカスタマーサポートの業務プロセス・組織変革の実現
recruitengineers
PRO
1
97
問い合わせ自動化の技術的挑戦
recruitengineers
PRO
2
200
「Air ビジネスツールズ」のクライアントサポートにおける生成 AI 活用
recruitengineers
PRO
0
71
AI活用のためのアナリティクスエンジニアリング
recruitengineers
PRO
1
87
SaaS事業のデータマネジメント事例
recruitengineers
PRO
0
84
Kaggleで鍛えたスキルの実務での活かし方 競技とプロダクト開発のリアル
recruitengineers
PRO
1
220
LLM のプロダクト導入における開発の裏側と技術的挑戦
recruitengineers
PRO
1
130
Other Decks in Technology
See All in Technology
元エンジニアPdM、IDEが恋しすぎてCursorに全業務を集約したら、スライド作成まで爆速になった話
doiko123
1
490
IBM Bobを使って、PostgreSQLのToDoアプリをDb2へ変換してみよう/202603_Dojo_Bob
mayumihirano
1
270
白金鉱業Meetup_Vol.22_Orbital Senseを支える衛星画像のマルチモーダルエンベディングと地理空間のあいまい検索技術
brainpadpr
2
260
Serverless Agent Architecture on Azure / serverless-agent-on-azure
miyake
1
160
JAWSDAYS2026_A-6_現場SEが語る 回せるセキュリティ運用~設計で可視化、AIで加速する「楽に回る」運用設計のコツ~
shoki_hata
0
2.9k
JAWS Days 2026 楽しく学ぼう! 認証認可 入門/20260307-jaws-days-novice-lane-auth
opelab
9
1.6k
マルチプレーンGPUネットワークを実現するシャッフルアーキテクチャの整理と考察
markunet
2
180
プロジェクトマネジメントをチームに宿す -ゼロからはじめるチームプロジェクトマネジメントは活動1年未満のチームの教科書です- / 20260304 Shigeki Morizane
shift_evolve
PRO
1
140
管理者向けGitHub Enterpriseの運用Tips紹介: 人にもAIにも優しいプラットフォームづくり
yuriemori
0
170
OCI Security サービス 概要
oracle4engineer
PRO
2
13k
Claude Codeが爆速進化してプラグイン追従がつらいので半自動化した話 ver.2
rfdnxbro
0
440
組織全体で実現する標準監視設計
yuobayashi
1
180
Featured
See All Featured
SEO for Brand Visibility & Recognition
aleyda
0
4.3k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.4k
Bash Introduction
62gerente
615
210k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
Utilizing Notion as your number one productivity tool
mfonobong
4
250
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
660
We Have a Design System, Now What?
morganepeng
55
8k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Accessibility Awareness
sabderemane
0
74
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
100
Transcript
RECRUIT TECH CONFERENCE 2026 LLM活用の本質:「作る視点」と「使う視点」 LLM活用の壁を超える: リクルートR&Dの戦略と打ち手 データ推進室 三田 雅人
三田 雅人 料理・テニス・ゲーム 経歴 / Career 理化学研究所、CyberAgent AI Labの研究者を経て、 2025年にリクルートにキャリア採用入社。
専門は、自然言語処理、計算心理言語学。 R&D組織にてLLMのプロダクト実装を推進。 2025年言語処理学会年次大会にて最優秀賞受賞。 趣味 / Hobbies プロダクト開発 データ推進室 データテクノロジーラボ部 R&Dグループ 2
リクルートにおけるR&D体制 - WhaleLM - 限られたLLM専門リソースを集中し、R&Dから事業実装のできるチームを育成、 全社レベルの事業優先度の高い中長期プロジェクトにアサイン R-ICT GPT 既製LLMの事業活用 OpenAI(Azure)のGPTシリーズ
中心でプロダクト適用、 Prompt Engineeringがメイン WhaleLM PoC ~ 事業実装 DS/MLEが中心でより高度なモデリング が必要かつ事業クリティカルになりうる LLM活用を推進 3
LLM活⽤フェーズが進み、ニーズがシャープに⾼難易度に 4 • カーセンサー ◦ チャットではなく既存UXに組み込み ➔ システム性能要件(レイテンシ等)が高い ◦ 効果直結の打ち手が明確:
レコメンド再ランキング/レコメンド軸提案 • HR キャリアアシスタントAI ◦ LLMがコア機能 ◦ SLM置換でインパクト大:コスト最適化+UX向上 ※画像はイメージです
⾼度なLLM活⽤でインパクト創出するための⽅針 領域施策実行 共通機能 検証/開発 施策・機能の 横展開 R&D モジュール の切り出し 領域側で
モジュール適用 横展開 機能の高度化 高度化した機能を逆輸入 R&Dから施策化 5
LLM活用の壁 • 非機能要件への対応(レイテンシ/スループット/コスト) ◦ 既存UXに組み込むには応答速度と安定運用が必須(=品質とのトレードオフ) ◦ ➔ 小型化・高速化・運用設計で“必要十分な品質”を保ちながら最適化 • 出力の制御性・指示追従性(フォーマット遵守/一貫性)
◦ 期待通りの形式・粒度・制約で出させないと、後段処理やUIが壊れる (=自由度とのトレードオフ) ◦ ➔ 運用側の制約設計に加え、学習で指示追従性を底上げして、狙い通りの出力を安定化 6
非チャットUIにおける生成文表示 • 課題:LLMで品質の高い生成文は実現できるがレイテンシやコスト面で△ ◦ 例: Gemini-2.5-flashを用いて推薦文を生成 ▪ 想定リクエスト量(30RPS)を保証するためには約970万円/月*1 ▪ レイテンシ:
1380ms/件(5000ms/5件) • 打ち手:SLMおよび推論高速化技術の活用 ◦ 例:SFT・知識蒸留・投機的デコーディング...など ◦ ➔ 性能改善しつつ約17.5倍高速化&運用料金を98.5%削減 モデル 最低要件遵守率 (%) ↑ レイテンシ (ms) ↑ 月額 (¥) ↓ 実タスク GPU=10 GPU=3 gemini-2.5-flash 97.4 1380 N/A N/A 9,700,000 llm-jp-3-150m w/ 蒸留・推論高速化 99.4 79 258 472 145,800 7 *1. 入力トークン:700, クエリあたりの出力レスポンステキストトークン数:150 設定における見積もり(2026年2月時点)
知識蒸留における忠実性改善 • 課題:「ショートカット学習」 ◦ 生徒モデルが教師モデルの推論・出力形式を真似せず、独自フォーマット/冗長回答 に逃げる(=忠実性の低下) • 打ち手:Adaptive Z-score Weighting
(AZ-Weighting) を提案 ◦ 学習中の損失履歴から各サンプルのZ-scoreで難易度を動的に推定 ◦ 教師との乖離が大きい(ショートカットしがちな)サンプルに勾配重みを強めて教師 分布へ寄せる ➔ フォーマット追従性(strict-match)が改善 モデル flexible-extract strict-match GKD [Agarwal+24] 68.69 43.85 w/ AZ-Weighting 69.75 47.16 JSAI2026 発表予定 8 例: GSM8K
まとめ:LLMをプロダクトに“組み込む”ためのR&D • ミッション:LLM専門人材・知見を集約し、R&D〜事業装着を一気通貫で推進する体制を 構築し、全社優先度の高い中長期テーマに集中投下 • 壁① 非機能要件(レイテンシ/スループット/コスト) ◦ SLM+推論高速化で“必要十分な品質”を保ちながらレイテンシ・コスト最適化 •
壁② 制御性・指示追従性(形式遵守/一貫性) ◦ 知識蒸留における忠実性を向上させるための道具立てを研究開発 • R&Dの提供価値: ◦ 横断組織として横展開:成功パターンをモジュール化(学習・推論・評価)して 複数領域・プロダクトへ再利用 ◦ ゼロイチで技術を作る:既存技術では解消が難しいギャップに対しては、 研究アプローチにより新技術を創出して課題解決に向けた道具立てを整備 9