総質問数: 4,937 特徴: 最大2ホップの推論を必要とする 3. GraphQ 特徴: 訓練セットが小さく、非独立同分布設定 実験設定 • 質問分解に使用したモデル: gpt3.5-turbo, llama2(7B) • 使用モデル: T5-baseモデル(約220Mパラメータ) • 学習設定 • CWQ: 16エポック,バッチサイズ16 • WebQSP,GraphQ: 20エポック,バッチサイズ8 • 最適化: AdamWオプティマイザ • 学習率: 2e-5から線形でウォームアップさせ、線形で減衰 • ハードウェア: V100GPU一基 評価指標 • F1スコア • Hit@1(5回のランダムサンプリングの平均)