Slide 25
Slide 25 text
25
Content Diversity Benchmark
● Metrics for content Diversity(McDiv)をリリース [Github]
○ 6000件の{Context, 文集合}のペアからなるデータセット
■ 各2000件 (storyGen, respGen, promptGen)
■ Form diversityが中立化されたchallengingセット(3000件)も含む -> McDiv_{nuggets}
McDiv_{nuggets}, 200 sets
McDiv(通常版), 6K sets