Graph Parsing [Li+(Monash Univ.), ACL23 (Findings)] ü 概要: Visual Genome [Krishna+, IJCV17] のシーングラフは faithfulness / consistency の観点からnoisy • Faithfulness: 不完全なシーングラフ (completeness / correctness) • Consistency: ⼀貫性のないシーングラフ • (there, are, three trees) ↔ (trees, has_attribute, three) • 意味的には同じだがノードの情報および有向辺の張り⽅が異なる • ⼤抵の inconsistency は数量詞に起因 [Krishna+, IJCV17] ü 提案: ①中間表現 FACTUAL-MR ② データセット FACTUAL • ① FACTUAL-MR: Faithfulness / Consistency を向上させる中間表現 (アノテーション時使⽤) • 従来の表現: {Object, Attribute, Object} [Anderson+, ECCV16] • FACTUAL-MR: {Quantifier, Object, Verb, Preposition, Quantifier, Object} • ② データセット FACTUAL: Visual Genomeを再度アノテーション ü FACTUAL-MRに基づく40,369個のシーングラフ群 Faithfulness / Consistency 共に向上 3 中間表現 FACTUAL-MR