次のように定式化できる:
LLM 20 Questions解法におけるLLM-as-a-Judge
- “question”を約500件用意
- “keyword”候補に対して、LLM-as-a-Judgeを行い、
“answer”を得る(yes, no, unsure, irrelevant)
- yes, no以外はtieとしてまとめることで
max_tokens=1に節約可能
- tieが50未満 かつ yesが50以上
- Wikipediaのタイトルに存在する
[1] Gu et al. (2024) A Survey on LLM-as-a-Judge. arXiv:2411.15594. [1]
keyword・question・answerテーブル
データセットTier表
Tokenization可視化
→Tier1