検索エンジニアが考える、生成AI時代の人間の付加価値とは

検索エンジニアが考える、生成AI時代の人間の付加価値とは株式会社リクルートデータ推進室大杉直也

大杉直也ボードゲーム経歴 / Career 2014年にリクルート新卒入社。 2017年、N高等学校に3年次編入（社会人高校生）。 2020年、同高校卒業。現在は、シニアサーチエンジニアとして働く傍ら、プロ
ンプトエンジニアリングの社内研修や事業現場へのヒアリングを踏まえた大規模言語モデルの利活用推進を実施している。現在、デジタル庁でもAI部門担当者として兼業中。趣味 / Hobbies データ推進室データテクノロジーユニットアジリティテクノロジー部 A/Bテスト実践ガイド（翻訳） Apache Solr 入門（第3版）出版物 / Publications

2023/02/10 2023/10/18 2023/03/03

2023/03/04 このあと、世の中的にはChatGPTプラグインが出たり、RAGという言葉が流行ったり、生成AIと組み合わせる汎用ベクターサーチが各クラウドサービスで発表されたり、ChatGPT にWeb browsingの機能がついたりと色々おきました大規模言語モデルは万能ではない。それを活用（既存手法を強化）＆補助（既存手法で強化）はまだまだやることが大量にある→おかげで仕事が増えた今日はその辺の話をします

今日の話の流れ ◼ 大規模言語モデルで既存手法を強化する話（活用） • 検索エンジンを強化する • ヒトを強化する ◼ 大規模言語モデルを既存手法で強化する話（補助） •
検索エンジンで強化する • ヒトで強化する ◼ 情報サービスx生成AIで作られる世界の方向性（予想）

大規模言語モデルで既存手法を強化する話（活用）検索編検索エンジニアが考える、生成AI時代の人間の付加価値とは

検索エンジンを大規模言語モデルで強化する検索エンジンデータ分析レポートフォーマット変換ラベリングデータクレンジング文章生成・要約など集計結果の解釈
インサイトの提案など更新処理・データ分析検索エンジン検索クエリ検索結果固有表現抽出クエリ意図推定など再フィルタリング検索結果の解釈などオレンジ色が大規模言語モデルで実現可能な処理

前述の処理のほとんどは大規模言語モデル以前の自然言語処理の手法でも実現可能大規模言語モデル以降では何が変わったか？ →汎用的なモデルに対してのプロンプトの工夫だけで多種多様な処理が実装可能 →→テストケース作成や開発リードタイムの大幅な削減さらに →該当処理の開発に必要なスキルが大きく変わった →→いわゆるプロンプトデザイン →→従来のデータサイエンス能力は品質評価の観点で依然重要このことから「より多くの人」で「多種多様な試行錯誤」を「迅速」
に行えるようになった理想は要件定義時点で企画者が「このプロンプトでいける！」と正しく言える状態そのための環境整備と教育をどうすべきかを社内で検証中

b 大規模言語モデルを既存手法で強化する話（補助）検索編検索エンジニアが考える、生成AI時代の人間の付加価値とは

検索エンジンで大規模言語モデルを強化する大規模言語モデルの弱点である 1. 知識のアップデートを大量・高速に実施 a. プロンプトに知識埋め込みはtoken数制約にひっかかる b. 追加学習は計算時間がかかる 2. 大量のデータを解釈性高く制御
a. 中身の処理がブラックボックスは検索エンジンが得意とするところなので、検索エンジンと組み合わせることが有効リクルートではこの検索エンジンを高品質にするための条件が揃っている

検索エンジンで大規模言語モデルを強化するために重要なもの検索対象のアイテム・リクルートでは全国の営業網からファクトチェックされた信頼のおけるアイテムが登録される検索のアルゴリズム・流行りの汎用型の埋め込み表現はドメイン特化の検索では品質いまいち。教師付き学習によるファインチューニングが必要・リクルートでは複数のドメインでシェア率業界トップクラスのWebサービスがあり、そこの検索関連ロ
グが優良なシグナルになる検索のシステム基盤・リクルートでは検索システムを、(1)汎用的なもの(2)特化型のものをそれぞれ提供する専門のエンジニア組織が存在（いわばスタートアップからエンタープライズまで）検索の評価・データ基盤が整備されており、社内にA/Bテストの専門家もいる

b 大規模言語モデルで既存手法を強化する話（活用）ヒト編検索エンジニアが考える、生成AI時代の人間の付加価値とは

ヒトを大規模言語モデルで強化するいわゆる生成AIによるDX案件リクルートだと「記事作成」「校閲」などが比重高そう記事作成取材した内容メモから記事タイトル案の提案 →きちんとファクトチェックしている校閲広告表示のガイドラインなどに抵触していないかの確認 →法律で明確に定められたルールを遵守するリクルートのメディアとして「品質」を担保する活動を強化できる

ヒトを大規模言語モデルで強化する記事テーマキーワード取材メモなど記事作成補助校閲補助記事原稿入稿情報など
この記事原案を元に記事を作れる必要なら大規模言語モデルとチャットしながら整えていく作家性が重要でない箇所（例：アクセス情報）の文章作成を省エネ化し、「どんなテーマ」で「どんな見出し」で「どんな構成にするか」といった拘りポイントにヒトは注力できるようになる過去の良い記事例記事作成のコツなど法令ガイドライン社内表記ルールなど＋＋オレンジ色が大規模言語モデルで実現可能な処理固有のルール記事原案社内限定の知識修正案リクルートでは実際に記事がリリースされる前の品質担保を重要視しているこの品質担保に必要な知識はかなり多く、レビューできる人材が希少リソースになりがち固有のルールによる判定を大規模言語モデルで行うことで (1)希少リソース人材の作文工数の削減 (2)希少リソース人材に頼らない初心者育成ができる

b 大規模言語モデルを既存手法で強化する話（補助）ヒト編検索エンジニアが考える、生成AI時代の人間の付加価値とは

ヒトで大規模言語モデルを強化する供給側の情報宿や飲食店や物件などヒトが介在しない場合ヒトが介在する場合生成AIだけでも、消費者像に合わせた加工は十分可能しかし、 (1)
そもそも供給側の情報は本当か (2) 文言が法律要件などに合うか (3) 本当に消費者に好ましいものかなどに不安が残るオレンジ色が大規模言語モデルで実現可能な処理ヒトが介在することで、上述の不安は解消され、以下のように付加価値をつけられる • 特に重要なのは、供給側(クライアント) と直接接点を持っていることで、消費者からのフィードバックを伝えることができる点 • これにより、需要と供給のバランスがより取りやすくなり、ムダの少ない効率的な市場経済が実現されやすくなる • また消費者の潜在的なニーズを顕在化するドライバーを作ることで (例：見出し文言)供給側(クライアントの種類)もより多様になっていく供給側の情報宿や飲食店や物件など消費者原案加工後情報消費者加工後情報校正ファクトチェック編集フィードバック

ヒトで大規模言語モデルを強化する現状の大規模言語モデルは以下の2つができない (1)現実世界のファクトチェック (2)何が良いものかの価値の最終判断価値向上には編集組織と営業組織との協業が不可欠 • 企画立案だけでなく、綿密な取材や実際にお客さんのところまで足を運び、意思決定できる人材がいる • クローリングなどによる「質より量の世界観」ではこれらは高コスト
体質と見なされがちだったが、生成AI時代では「量」は誰でもできるようになり、「質」が重要になるはず • そしてこの「質」を組織的に得られるようになるには一朝一夕ではなかなか難しいのではないか？

サービスヒト検索エンジン生成AI 不足を補う不足を補う機能強化生産性向上機能提供利便性向上
価値向上生成AI時代はこの世界観でより良いものが作られていく（はず）

検索エンジニアが考える、生成AI時代の人間の付加価値とは

検索エンジニアが考える、生成AI時代の人間の付加価値とは

Recruit
PRO

More Decks by Recruit

Other Decks in Technology

Featured

Transcript