Textual Descriptions for Improved Image Retrieval [Sebastian+ ACL2015]で用いられたScene Graph Parser 1. Quantificational modifiers ⇒ “a lot of”の”lot”のような何かに依存する名詞をつなげる 2. Pronoun resolution ⇒ 代名詞が何を指しているのか 3. Plural nouns ⇒ 複数形はそれぞれに分割 4. Rule-Based Parser ⇒ ルールに従って属性と関係性を抽出 5. Classifier-Based Parser a. Object and Attribute Extraction ⇒ 他の単語でも属性を表現できているか e.g. “the person beside me” = “the person next to me” b. Relation Prediction ⇒ 物体同士の関係性を見ていく 14 https://aclanthology.org/W15-2812.pdf