Questions)での回答品質をGPT-4、及び人手で評価 No 質問文 (Question) 要約結果 (Answer) 要約元テキスト (Context) 回答あり 引用の正確性 (GPT-4評価) 理由 (GPT-4評価) 出力形式の忠実性 (人手評価) 回答の関連性 (人手評価) 0 日本の総合化学メー カーを3社答えてくだ さい。 三井化学[index:0] 三菱ケミカルホール ディングス[index:0] 住友化学[index:0] ... 1. 『えきPET吸音材』の概 要 ・ 駅で回収したペットボトル をリサイクルした吸音材を 開発し... 1 0 要約はソーステキストを誤っ て表現しています。ソーステ キストには、日本の総合化学 メーカー3社についての言及 はありません ... 1 1 1 日本の人工知能のス タートアップ企業を 1 社答えてください。 日本の人工知能のス タートアップ企業を 1社 答えることができます。 Fotographer AI株式会 社がStability AI... [0] 生成AIによる商品写真 自動生成サービス 「Fotographer.ai」を提供す るFotographer AI株式会 社... 1 1 要約はソーステキストを歪め たり、誤解を招くような表現を していません。 Fotographer AI株式会社が Stability AI Japan株式会社の ... 1 1 12 ※各評価指標は Ragas 等を参考に設定