そのPoC、何を検証したつもりでしたか？ AIプロダクトの価値検証で陥った落とし穴

そのPoC、何を検証したつもりでしたか？ AIプロダクトの価値検証で陥った落とし穴パーソルキャリア株式会社クライアントプロダクト本部プロダクトマネジメント統括部 PdM2G 鳥居俊介 2026年05月12日 ※本資料は2026年5月時点の情報です

© PERSOL CAREER CO., LTD. 2 鳥居俊介 Shunsuke Torii
パーソルキャリア株式会社クライアントプロダクト本部プロダクトマネジメント統括部 PdM2G ディレクター／プロダクトマネージャー 2018年パーソルキャリア入社。 Webディレクター／PdMとして、スクラムチーム運営やプロジェクトマネジメントを経験。人材業界歴は10年以上。現在は「dodaダイレクト」にて、AI・LLMを活用した機能開発のPOとして、実装の推進や価値判断に取り組んでいる。プライベートではレコードコレクター／DJとして活動。日本ではまだ十分に紹介されていないブラジル北東部音楽〈Forró（フォホー）〉の研究・紹介に力を注ぎ、2026年4月にディスクガイドを刊行。あわせて、1970年代日本ジャズの未発表音源の発掘にも取り組んでいる。

© PERSOL CAREER CO., LTD. 3 会社概要社名本
社創業資本金事業内容従業員数パーソルキャリア株式会社東京都港区 1989年6月 1,127百万円人材紹介サービス、求人メディアの運営、転職・就職支援、採用・経営支援、副業・兼業・フリーランス支援サービスの提供 6,721名（有期社員含むグループ会社出向中の者は除く 2026年3月1日時点）

© PERSOL CAREER CO., LTD. 6 日本最大級 *1 のスカウト会員を活用したダイレクト・リクルーティングサービス
dodaダイレクトの理解とLLM化ポイント ▼ダイレクトサービスの特徴企業が直接候補者を検索し、スカウトを送る能動的な採用サービスです。人材紹介サービスや求人情報サービスと違い、利用企業の積極的なアクションが必要です。 ▼企業のサービス利用フロー ①求人票を作成する ②求人票をもとに求職者を検索する ③求職者に合った文面を作成しメール送信 ④応募があれば面接 *1 厚生労働省職業安定局人材サービス総合サイト（2023年1月時点）

© PERSOL CAREER CO., LTD. 7 dodaダイレクト内のAI（LLM）機能スカウト対象者検索条件設定（2025年リリース）スカウト文面生成（2026年夏リリース予定）
作成済の求人→検索条件を自動設定作成済の求人＆スカウト送信したい求職者から文面を自動生成 Sample（スクショNG）

© PERSOL CAREER CO., LTD. 8 そのPoC、何を検証したつもりでしたか？ AIプロダクトの価値検証で陥った落とし穴前提まだAIプロダクトと言える状態ではない。
体験の一部にしかAIを入れられていない為、AI施策単位の価値を見たときの経験談。 AI（LLM）の精度検証を主目的としたPoCを実施した結果、一定の手応えは得られたものの、実装後の体験において想定外の迷いや手戻りが発生した事例をもとに、価値検証の進め方を振り返ります。セッション概要

© PERSOL CAREER CO., LTD. 9 ビジネス成果＝価値としたとき、dodaダイレクトの場合下記連鎖により、ビジネス成果が生まれる AI機能の場合新AI機能 →
業務改善 → ユーザー行動変化 → ビジネス成果 Not AIの場合（考え方は同じ）新規機能→ 業務改善 → ユーザー行動変化 → ビジネス成果プロダクトによるかもしれないが、AI施策であろうと、見るべき価値指標はあまり変わらないと個人的には捉えている。一方で、機能として性能（＝AI性能）評価する部分は違いが生まれている AI施策の価値指標（施策単位） AI機能の場合新AI機能 → 業務改善 → ユーザー行動変化 → ビジネス成果 Not AI機能の場合新規機能 → 業務改善 → ユーザー行動変化 → ビジネス成果変わらない部分変わる部分

© PERSOL CAREER CO., LTD. 10 AI施策の価値指標（施策単位）違う角度で整理した表。大きく3レイヤーで価値を定義。 ③AIシステム価値（モデル性能）と②プロダクト価値（顧客体験・行動・効率）指標の一部は、PoCやユーザーテスト内
で指標を確認しながら開発を進めた。レイヤー分類指標例確認タイミング指標の変化（AI観点） 1.ビジネス ①ビジネス価値（最終価値）売上・利益（Revenue, LTV）コンバージョン率（CVR）解約率 / 継続率コスト削減額 ROI / 投資対効果リリース後変わらない 2.プロダクト ②プロダクト価値（顧客体験・行動・効率） Time to Value（価値到達時間）利用継続率 / DAU・MAU Task Success Rate（タスク成功率） User Acceptance Rate（提案採用率）リードタイム短縮作業時間削減率リリース前（ユーザーテスト）／リリース後変わらない 3.モデル ③AIシステム価値（モデル性能） Accuracy / Precision / Recall / F1 応答時間（Latency）ハルシネーション率コスト/リクエストリリース前（PoC）／リリース後変わる（特有）

© PERSOL CAREER CO., LTD. 11 PoC、ユーザーテストの違い PoC そのアイデア・技術は成立するか？ユーザーテスト
そのプロダクトはユーザーに受け入れられるか？ ③AIシステム価値（モデル性能）／PoC検証

© PERSOL CAREER CO., LTD. 12 •PoC検証指標例＝③AIシステム価値（モデル性能）モデル×プロンプト（Step分割など手法含む）により、アウトプット品質、料金（＝ROI）に影響する選択する技術（モデル×プロンプト）とコスト見合いで、実現性（機能を提供し続けられるか？）を見極めた。
「アウトプット品質」はユーザーテストしないと見極められないため、PoCは候補として優先順位を絞り込むような役割とした（最終的な評価はユーザーテストと行き来した） ③AIシステム価値／PoC検証（AI施策特有の評価）モデルプロンプトアウトプット品質月額料金導入量（世の中に知識があるか）候補（実現性）モデルA 分割数1 × 〇〇分割数2 〇 × 〇モデルB 分割数1 △ 〇〇 2 分割数2 〇〇〇 1 モデルC … … … × …

© PERSOL CAREER CO., LTD. 13 •アウトプット品質評価指標例施策毎（AIのタスク内容）に評価指標は変わる。長文読解など回答のブレが起こりやすい場合は、回答を分類して品質、一貫性を評価する様な工夫をしたことも。
「1.期待の回答」割合により、「②プロダクト価値（体験・効率）」が変わるため、工夫を繰り返し、LLMの回答精度を向上、安定化させた。評価がPdMでは不安な部分は、ユーザー（ユーザーに近い立場）を巻き込み評価を実施した ③AIシステム価値／PoC検証（AI施策特有の評価）モデルプロンプトアウトプット品質回答品質（Accuracy / Precision / Recall / F1）ハルシネーション率応答速度 1.期待の回答 2.期待の一部のみ回答 3.期待＋期待外の回答 4.期待外のみ回答回答品質総評モデルA 分割数1 3 0 6 1 × 分割数2 5 0 3 2 × モデルB 分割数1 5 2 2 1 △ 分割数2 7 2 1 0 〇 1.期待の回答 2.期待の一部のみ回答 3.期待＋期待外の回答 4.期待外のみ回答

© PERSOL CAREER CO., LTD. 14 •Accuracy / Precision /
Recall / F1 補足 1.期待の回答 2.期待の一部のみ回答 3.期待＋期待外の回答 4.期待外のみ回答指標一言でいうとビジネス解釈 Accuracy 全体正解率全体のうち、どれだけ当たったか Accuracy = (正解数) / (全部) KPI未整備時の大雑把な評価 Precision 的中率「AIがYesと言ったものの中で、どれだけ本当にYesか」 Precision = TP / (TP + FP) 無駄撃ちを減らしたい Recall 取りこぼし防止「本来Yesのものを、どれだけ取りこぼさず拾えたか」 Recall = TP / (TP + FN) 見逃しを防ぎたい F1 バランス PrecisionとRecall のバランスを1つにした指標 F1 = 2 × (Precision × Recall) / (Precision + Recall) 両方重要

© PERSOL CAREER CO., LTD. 15 •PoC～ユーザーテストその他指標例前スライドの回答品質と合わせ、回答品質毎の作業時間削減を評価。リリース前は体感で削減につながりそうかをヒアリング程度で実施ユーザーテスト段階の価値検証
モデルプロンプトアウトプット品質作業時間削減率or(秒) LT 削減率or(日) モデルA 分割数1 × × 分割数2 × × モデルB 分割数1 〇 × 分割数2 〇 ×

© PERSOL CAREER CO., LTD. 16 ③AIシステム価値（モデル性能）回答精度（品質）OK！回答の安定性もOK！今回の回答精度なら効率化に繋がると
ユーザーから回答あり！ LLM部分をリリース可能な品質に！順調と思いきや・・

© PERSOL CAREER CO., LTD. 17 ②プロダクト価値（顧客体験・行動）で課題発生後続のユーザーテストにて・・落とし穴（後続のユーザーテストにて…）必須項目A、Bのうち
項目Aだけ自動生成されても、項目Bが自動生成されないなら LLM新機能は使わないかな ③AIシステム価値（モデル性能）の磨きこみを優先した結果、テスト後半で「体験・行動」部分の致命的な見落としを発見。途中でスコープ変更し対応することに・・（スケジュール遅延発生）そもそもの企画検討不足に加え、 ③AIシステム価値（モデル性能）に改善集中していた結果、 ②プロダクト価値（顧客体験・行動）のテストが後回しになり、課題発見の遅れが発生 AI・LLM精度＞体験にならないように注意精度も体験も同等にチェックする

© PERSOL CAREER CO., LTD. 18 • ②プロダクト価値（顧客体験・行動・効率）指標例ユーザーの課題解決度（“使って価値が出たか”）
→AI施策外でも確認している指標が中心 →AIにより成果を出しやすくなった指標例 Time to Value（価値到達時間）利用継続率 / DAU・MAU Task Success Rate（タスク成功率） User Acceptance Rate（提案採用率）リードタイム短縮作業時間削減率プロダクト価値（顧客体験・行動・効率）

© PERSOL CAREER CO., LTD. 19 • ①ビジネス価値（最終価値）指標例 AIが最終的に生んだ事業成果
→AI施策外でも確認している指標が中心指標例売上・利益（Revenue, LTV）コンバージョン率（CVR）解約率 / 継続率コスト削減額 ROI / 投資対効果ビジネス価値（最終価値）検証

© PERSOL CAREER CO., LTD. 20 まとめ AI施策単位の場合の価値指標 • 3.モデルレイヤー部分「③AIシステム価値（モデル性能）」で特にAI特有の価値指標が発生する。
• AI施策でよりフォーカスされたプロダクト価値指標は他施策でも転用可能。特性に合わせて適切に設定する • AI施策だと「③AIシステム価値」検証を優先しがちだが、「②プロダクト価値（顧客体験・行動）」も早めにテストするレイヤー分類指標例確認タイミング指標の変化（AI観点） 1.ビジネス ①ビジネス価値（最終価値）売上・利益（Revenue, LTV）コンバージョン率（CVR）解約率 / 継続率コスト削減額 ROI / 投資対効果リリース後変わらない 2.プロダクト ②プロダクト価値（顧客体験・行動・効率） Time to Value（価値到達時間）利用継続率 / DAU・MAU Task Success Rate（タスク成功率） User Acceptance Rate（提案採用率）リードタイム短縮作業時間削減率リリース前（ユーザーテスト）／リリース後変わらない 3.モデル ③AIシステム価値（モデル性能） Accuracy / Precision / Recall / F1 応答時間（Latency）ハルシネーション率コスト/リクエストリリース前（PoC）／リリース後変わる（特有）

© PERSOL CAREER CO., LTD. 21 最後に・・・AIプロダクトの価値検証（非経験談） AIプロダクトとは？ • 既存サービスの一部をAIに置き換える
… 短期ROI / リスク低 / 差別化弱 • AI前提でサービス設計する …中長期価値 / 競争優位 / リスク高

ご清聴ありがとうございました【免責事項】本資料に含まれる技術情報は発表日時点のものであり、予告なく変更される場合があります。実装や運用は自己責任で行ってください。発表者および所属組織は、本資料に基づく行動の結果について一切の責任を負いません。本資料に記載されている会社名・製品名などは、一般に各社の登録商標または商標、商品名です。資料内では ©, ®, TM
マークなどは表示していません。

そのPoC、何を検証したつもりでしたか？ AIプロダクトの価値検証で陥った落とし穴

そのPoC、何を検証したつもりでしたか？ AIプロダクトの価値検証で陥った落とし穴

PERSOL CAREER Dev | techtekt PRO

Resources

パーソルキャリア IT/テクノロジー職向け会社紹介資料｜Company Introduction Deck

More Decks by PERSOL CAREER Dev | techtekt

Other Decks in Technology

Featured

Transcript

© PERSOL CAREER CO., LTD. 2 鳥居俊介 Shunsuke Torii

© PERSOL CAREER CO., LTD. 3 会社概要社名本

© PERSOL CAREER CO., LTD. 4 サービス概要

© PERSOL CAREER CO., LTD. 5 サービス概要

© PERSOL CAREER CO., LTD. 6 日本最大級 *1 のスカウト会員を活用したダイレクト・リクルーティングサービス

© PERSOL CAREER CO., LTD. 7 dodaダイレクト内のAI（LLM）機能スカウト対象者検索条件設定（2025年リリース）スカウト文面生成（2026年夏リリース予定）

© PERSOL CAREER CO., LTD. 8 そのPoC、何を検証したつもりでしたか？ AIプロダクトの価値検証で陥った落とし穴前提まだAIプロダクトと言える状態ではない。

© PERSOL CAREER CO., LTD. 9 ビジネス成果＝価値としたとき、dodaダイレクトの場合下記連鎖により、ビジネス成果が生まれる AI機能の場合新AI機能 →

© PERSOL CAREER CO., LTD. 11 PoC、ユーザーテストの違い PoC そのアイデア・技術は成立するか？ユーザーテスト

© PERSOL CAREER CO., LTD. 13 •アウトプット品質評価指標例施策毎（AIのタスク内容）に評価指標は変わる。長文読解など回答のブレが起こりやすい場合は、回答を分類して品質、一貫性を評価する様な工夫をしたことも。

© PERSOL CAREER CO., LTD. 14 •Accuracy / Precision /

© PERSOL CAREER CO., LTD. 16 ③AIシステム価値（モデル性能）回答精度（品質）OK！回答の安定性もOK！今回の回答精度なら効率化に繋がると

© PERSOL CAREER CO., LTD. 17 ②プロダクト価値（顧客体験・行動）で課題発生後続のユーザーテストにて・・落とし穴（後続のユーザーテストにて…）必須項目A、Bのうち

© PERSOL CAREER CO., LTD. 18 • ②プロダクト価値（顧客体験・行動・効率）指標例ユーザーの課題解決度（“使って価値が出たか”）

© PERSOL CAREER CO., LTD. 19 • ①ビジネス価値（最終価値）指標例 AIが最終的に生んだ事業成果

© PERSOL CAREER CO., LTD. 20 まとめ AI施策単位の場合の価値指標 • 3.モデルレイヤー部分「③AIシステム価値（モデル性能）」で特にAI特有の価値指標が発生する。

© PERSOL CAREER CO., LTD. 21 最後に・・・AIプロダクトの価値検証（非経験談） AIプロダクトとは？ • 既存サービスの一部をAIに置き換える

そのPoC、何を検証したつもりでしたか？ AIプロダクトの価値検証で陥った落とし穴

そのPoC、何を検証したつもりでしたか？ AIプロダクトの価値検証で陥った落とし穴

Resources

パーソルキャリア IT/テクノロジー職向け 会社紹介資料｜Company Introduction Deck

More Decks by PERSOL CAREER Dev | techtekt

Other Decks in Technology

Featured

Transcript

パーソルキャリア IT/テクノロジー職向け会社紹介資料｜Company Introduction Deck