Slide 5
Slide 5 text
⚖ Japanese MT-Bench での日本語 LLM の言語生成評価
● Chatbot Arena で有名な LLM-as-a-judge 論
文の手法に沿って作られた会話形式の日本
語特化の LLM 言語生成評価データセット
(MT は Multi-Turn の省略)
● 8つの応用領域の問題を含む。各問題に正確
に答えるために、LLMは以下の要求を同時に
満たす必要があります:
● 流暢な日本語を生成する
● 世界の知識を理解する
● 日本文化、社会を理解する
● 推論や数学の能力を持つ
● 文脈を理解し、利用者と対話すること