● 人手のアノテーションは高コストなので、GPT-4を利用してデータセットを
作成
● Retrieveのトークンを学習するための戦略
○ データ収集
■ 学習データからランダムに2つの文(クエリと生成済み文章)を収集
○ プロンプト
■ Given an instruction, make a judgment on whether finding some external
documents from the web helps to generate a better response.
■ 訳:ウェブから外部の文書を探し出すことがより良い回答を生成するのに役立
つかどうかを判断します。
Criticモデルを学習するためのデータの作成
16