Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Recruit
PRO
February 27, 2026
Technology
1
400
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
2026/2/27に、RECRUIT TECH CONFERENCE 2026で発表した三田の資料になります。
Recruit
PRO
February 27, 2026
Tweet
Share
More Decks by Recruit
See All by Recruit
まなび領域における生成AI活用事例
recruitengineers
PRO
2
160
AI時代にエンジニアはどう成長すれば良いのか?
recruitengineers
PRO
1
270
AIを用いたカスタマーサポートの業務プロセス・組織変革の実現
recruitengineers
PRO
1
150
問い合わせ自動化の技術的挑戦
recruitengineers
PRO
2
240
「Air ビジネスツールズ」のクライアントサポートにおける生成 AI 活用
recruitengineers
PRO
0
110
AI活用のためのアナリティクスエンジニアリング
recruitengineers
PRO
2
160
SaaS事業のデータマネジメント事例
recruitengineers
PRO
0
140
Kaggleで鍛えたスキルの実務での活かし方 競技とプロダクト開発のリアル
recruitengineers
PRO
1
470
LLM のプロダクト導入における開発の裏側と技術的挑戦
recruitengineers
PRO
1
200
Other Decks in Technology
See All in Technology
FastMCP OAuth Proxy with Cognito
hironobuiga
3
230
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
3
2k
自分をひらくと次のチャレンジの敷居が下がる
sudoakiy
2
240
遊びで始めたNew Relic MCP、気づいたらChatOpsなオブザーバビリティボットができてました/From New Relic MCP to a ChatOps Observability Bot
aeonpeople
1
120
出版記念イベントin大阪「書籍紹介&私がよく使うMCPサーバー3選と社内で安全に活用する方法」
kintotechdev
0
120
GitHub Advanced Security × Defender for Cloudで開発とSecOpsのサイロを超える: コードとクラウドをつなぐ、開発プラットフォームのセキュリティ
yuriemori
1
110
開発チームとQAエンジニアの新しい協業モデル -年末調整開発チームで実践する【QAリード施策】-
kaomi_wombat
0
270
OCI技術資料 : ロード・バランサ 概要 - FLB・NLB共通
ocise
4
27k
SaaSの操作主体は人間からAIへ - 経理AIエージェントが目指す深い自動化
nishihira
0
120
「活動」は激変する。「ベース」は変わらない ~ 4つの軸で捉える_AI時代ソフトウェア開発マネジメント
sentokun
0
130
AIエージェント勉強会第3回 エージェンティックAIの時代がやってきた
ymiya55
0
170
スケーリングを封じられたEC2を救いたい
senseofunity129
0
130
Featured
See All Featured
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.4k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
280
Accessibility Awareness
sabderemane
0
87
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
180
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8k
The agentic SEO stack - context over prompts
schlessera
0
720
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Prompt Engineering for Job Search
mfonobong
0
240
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
95
KATA
mclloyd
PRO
35
15k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
97
Transcript
RECRUIT TECH CONFERENCE 2026 LLM活用の本質:「作る視点」と「使う視点」 LLM活用の壁を超える: リクルートR&Dの戦略と打ち手 データ推進室 三田 雅人
三田 雅人 料理・テニス・ゲーム 経歴 / Career 理化学研究所、CyberAgent AI Labの研究者を経て、 2025年にリクルートにキャリア採用入社。
専門は、自然言語処理、計算心理言語学。 R&D組織にてLLMのプロダクト実装を推進。 2025年言語処理学会年次大会にて最優秀賞受賞。 趣味 / Hobbies プロダクト開発 データ推進室 データテクノロジーラボ部 R&Dグループ 2
リクルートにおけるR&D体制 - WhaleLM - 限られたLLM専門リソースを集中し、R&Dから事業実装のできるチームを育成、 全社レベルの事業優先度の高い中長期プロジェクトにアサイン R-ICT GPT 既製LLMの事業活用 OpenAI(Azure)のGPTシリーズ
中心でプロダクト適用、 Prompt Engineeringがメイン WhaleLM PoC ~ 事業実装 DS/MLEが中心でより高度なモデリング が必要かつ事業クリティカルになりうる LLM活用を推進 3
LLM活⽤フェーズが進み、ニーズがシャープに⾼難易度に 4 • カーセンサー ◦ チャットではなく既存UXに組み込み ➔ システム性能要件(レイテンシ等)が高い ◦ 効果直結の打ち手が明確:
レコメンド再ランキング/レコメンド軸提案 • HR キャリアアシスタントAI ◦ LLMがコア機能 ◦ SLM置換でインパクト大:コスト最適化+UX向上 ※画像はイメージです
⾼度なLLM活⽤でインパクト創出するための⽅針 領域施策実行 共通機能 検証/開発 施策・機能の 横展開 R&D モジュール の切り出し 領域側で
モジュール適用 横展開 機能の高度化 高度化した機能を逆輸入 R&Dから施策化 5
LLM活用の壁 • 非機能要件への対応(レイテンシ/スループット/コスト) ◦ 既存UXに組み込むには応答速度と安定運用が必須(=品質とのトレードオフ) ◦ ➔ 小型化・高速化・運用設計で“必要十分な品質”を保ちながら最適化 • 出力の制御性・指示追従性(フォーマット遵守/一貫性)
◦ 期待通りの形式・粒度・制約で出させないと、後段処理やUIが壊れる (=自由度とのトレードオフ) ◦ ➔ 運用側の制約設計に加え、学習で指示追従性を底上げして、狙い通りの出力を安定化 6
非チャットUIにおける生成文表示 • 課題:LLMで品質の高い生成文は実現できるがレイテンシやコスト面で△ ◦ 例: Gemini-2.5-flashを用いて推薦文を生成 ▪ 想定リクエスト量(30RPS)を保証するためには約970万円/月*1 ▪ レイテンシ:
1380ms/件(5000ms/5件) • 打ち手:SLMおよび推論高速化技術の活用 ◦ 例:SFT・知識蒸留・投機的デコーディング...など ◦ ➔ 性能改善しつつ約17.5倍高速化&運用料金を98.5%削減 モデル 最低要件遵守率 (%) ↑ レイテンシ (ms) ↑ 月額 (¥) ↓ 実タスク GPU=10 GPU=3 gemini-2.5-flash 97.4 1380 N/A N/A 9,700,000 llm-jp-3-150m w/ 蒸留・推論高速化 99.4 79 258 472 145,800 7 *1. 入力トークン:700, クエリあたりの出力レスポンステキストトークン数:150 設定における見積もり(2026年2月時点)
知識蒸留における忠実性改善 • 課題:「ショートカット学習」 ◦ 生徒モデルが教師モデルの推論・出力形式を真似せず、独自フォーマット/冗長回答 に逃げる(=忠実性の低下) • 打ち手:Adaptive Z-score Weighting
(AZ-Weighting) を提案 ◦ 学習中の損失履歴から各サンプルのZ-scoreで難易度を動的に推定 ◦ 教師との乖離が大きい(ショートカットしがちな)サンプルに勾配重みを強めて教師 分布へ寄せる ➔ フォーマット追従性(strict-match)が改善 モデル flexible-extract strict-match GKD [Agarwal+24] 68.69 43.85 w/ AZ-Weighting 69.75 47.16 JSAI2026 発表予定 8 例: GSM8K
まとめ:LLMをプロダクトに“組み込む”ためのR&D • ミッション:LLM専門人材・知見を集約し、R&D〜事業装着を一気通貫で推進する体制を 構築し、全社優先度の高い中長期テーマに集中投下 • 壁① 非機能要件(レイテンシ/スループット/コスト) ◦ SLM+推論高速化で“必要十分な品質”を保ちながらレイテンシ・コスト最適化 •
壁② 制御性・指示追従性(形式遵守/一貫性) ◦ 知識蒸留における忠実性を向上させるための道具立てを研究開発 • R&Dの提供価値: ◦ 横断組織として横展開:成功パターンをモジュール化(学習・推論・評価)して 複数領域・プロダクトへ再利用 ◦ ゼロイチで技術を作る:既存技術では解消が難しいギャップに対しては、 研究アプローチにより新技術を創出して課題解決に向けた道具立てを整備 9