Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「高い不確実性」を解消する「高い再現性」 / 2025.09.14 プロダクトヒストリーカンフ...

Avatar for Shumpei Miyawaki Shumpei Miyawaki
September 19, 2025
180

「高い不確実性」を解消する「高い再現性」 / 2025.09.14 プロダクトヒストリーカンファレンス(YOUTRUST)

こちらのイベントでの登壇資料になります。
https://findy.connpass.com/event/363543/

Avatar for Shumpei Miyawaki

Shumpei Miyawaki

September 19, 2025
Tweet

More Decks by Shumpei Miyawaki

Transcript

  1. 採用担当者が「 」に向きあえる環境づくりを支援します! ひとが価値を出すべき業務 ※ 導入企業A社のコメントを引用 現場の声から生まれた採用支援AIエージェント 採用担当者が審査結果を納品 レジュメを ドラッグ&ドロップ Eメールで

    レジュメを受付 AI人材リクルーターが 履歴書の山から瞬時に マッチする応募者を 事前にピックアップ ◦◦経験 △△経験 スキル 母集団形成 採用計画 担当者 リクルタAI スカウト 書類選考 低次面接 高次面接 人の判断が 価値を生む 人の信頼関係が より価値を生む 人の判断基準に従った 一定水準以上の価値を提供 たくさん すばやく (参考)みずほリサーチ&テクノロジーズ, AI利活用がもたらす日本経済への影響 (2025) プレ面談 書類選考 ── 実際にリクルタをどのように活用されましたか? リクルタの導入後は、AIエージェントによる自動スカウトと、カスタマーサクセス担当 者による手厚いサポートを活用してきました。AIの精度が徐々に上がっていき、 私たちのイメージする人材像により近い候補者の発掘ができるように なりました。 ── リクルタ導入の効果はいかがでしたか? 最も大きな成果は、先月にビジネスコンサルタントの採用に成功したことです。このポ ジションは約3年間、エージェント様からなかなか候補者をご紹介いただけない状況が 続いていました。市場に候補者が少なく採用競合も多い中で、優秀な人材を採用できた ことは、大きな成果でした。 ダイレクト採用 採用方針や想いを反映 カレンダーをあけて待つだけ
  2. 高橋 - あらゆる産業を「ネオ化」する ― 生成AIネイティブな事業のレシピ (2024) Sell Work, Not Software

    10人分の野菜を切る 10人分の野菜を炒めて煮込む 10人分のカレーを皿に盛り付ける
  3. 高橋 - あらゆる産業を「ネオ化」する ― 生成AIネイティブな事業のレシピ (2024) Sell Work, Not Software

    10人分の野菜を切る 10人分の野菜を炒めて煮込む 10人分のカレーを皿に盛り付ける 100x 「10人分のカレーを効率的に作る」ではなく 「1000人分のカレーをどう作るか」
  4. 高橋 - あらゆる産業を「ネオ化」する ― 生成AIネイティブな事業のレシピ (2024) Sell Software Work, Not

    1000人分の野菜を切る(100x) 10人分の野菜を炒めて煮込む + 990人分の野菜が調理待ち... 10人分のカレーを皿に盛り付ける + 990人分の皿なんてない!
  5. 高橋 - あらゆる産業を「ネオ化」する ― 生成AIネイティブな事業のレシピ (2024) Sell Work, Not Software

    AIツールを提供するだけではなく、業務のあり方から見つめ直す
  6. 転職活動には時間がかかる 転職活動スタート 〜 内定・入社 の日数 ※パーソルグループ(2025) 求人公開 〜 最初の採用決定報告 の日数

    ※ Indeed 調べ(2025/01) 42 日間 3 ヶ月 リクルートホールディングス - 就業までに掛かる時間を半分にする doda - 転職活動にかかる期間の目安は?スケジュールの立て方を解説 (2025) 企業側も時間がかかる 求職者も時間がかかる
  7. 潮の流れが速い LLM プロダクトにおいては 「小さくはやく回しまくる」のが成功のカギ 22 不確実性の高いプロジェクトでは「障壁の解体」を優先する 初期段階では「AIでなにが・どこまでできる」という情報の非対称性(障壁)が存在する まずは精度感・リスクについて各メンバーと共通認識をもつ 鷲崎ら『QA to

    AQ:アジャイル品質パターンによる、伝統的な品質保証からア ジャイル品質への変革』、翔泳社、https://amzn.asia/d/9yvEdHy コールドスタートにおける技術不確実性の解消段階では 「定量評価」以上に「障壁の解体」にこだわる
  8. 26 LLM の性能が高くなっても、回答品質のコンテキスト依存は変わらない 複数の正解候補から回答するのは難しい トンネルを抜けると AI 海 が広がっていた 雪国 であった

    不思議 の町でした 意向を汲んでくれるわけではない = コンテキストの曖昧性 = モデルの不確実性 出力の再現性が低いのは ①コンテキストの曖昧性 ②モデルの不確実性 による
  9. 27 テクニックは気にせず、まずは具体的で伝わりやすい表現で書く モデルの言語運用能力に責任転嫁 トンネルを抜けると AI 海 が広がっていた 雪国 であった 不思議

    の町でした コンテキストの曖昧性を解消することで 川端康成コンテキスト 千と千尋コンテキスト 「再現性の高いプロンプト」とは、言語モデルの機能的能力に依存しないということ 追従性の高いAIであれば同じ出力が期待されるような詳細な指示文を記述するとよい
  10. 29 評価観点、正常・異常ケースは切り離し、定量評価や回帰テストに紐付けておく あなたは優れたアシスタント ... 略)
 ## タスク規約 ### 回答と推論過程の評価観点 ###

    異常入力の出力例 ### 出力制約 ### 出力形式 次の観点から公平に評価され、その結果に応じて報酬値が変動します
 metric metrics ユーザー入力に異常を検知した場合は、システムエラーの文言を提示すること err error_messages cn constraints {% %} {% %} {% %} {% %} {% %} {% %} for in endfor for in endfor for in endfor - {{ metric.title }}: {{ metric.description }} - {{ err.title }}: {{ err.content }} - {{ cn.title }}: {{ cn.content }} {{ output_format }} → これらをテスト項目に紐付けておく
  11. 34 エラーは伝搬するもの。まずは小さく丁寧に作るところから。 モデルに依存した指示・ループ構造を伴う ReAct 型エージェントはエラー伝搬が起きやすい まずは既存の業務フローを明確にしてワークフローを構築することから始める ワークフロー エージェント Anthropic -

    Building effective agents (2024) 宮田氏 - LLMを今すぐビジネスに活かすなら「エージェント」の前に「ワークフロー」〜MLラボのチャレンジから見えてきた知見〜 (2025) エラー伝搬による暴走 挙動が読みづらく改善策も立てづらい 定義された手順に沿って動くため正常・異常ケースも定義しやすい
  12. 35 エージェントシステムはシンプルに設計しよう シンプルに設計する、階層構造は2層で十分 ツール名にはサービス・リソース別に名前空間を付与して機能別に役割を区別する
 e.g. projects_search、 users_search
 サブエージェントはステートレスに純粋な関数として実装する サブエージェントには応答責任をなるべく持たせない
 e.g.

    google-adk の場合、Sub-agent より Agent-as-a-Tool を採用する asana_ asana_ ※ この辺りのベストプラクティスは確立されていないのでぜひ一緒にやりましょう! Anthropic - Writing effective tools for agents — with agents (2025) Taslim - Best Practices for Building Agentic AI Systems: What Actually Works in Production (2025)