Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介201904_Exploring Semantic Properties of Sentence Embeddings

T.Tada
April 04, 2019

文献紹介201904_Exploring Semantic Properties of Sentence Embeddings

T.Tada

April 04, 2019
Tweet

More Decks by T.Tada

Other Decks in Technology

Transcript

  1. - 文献紹介 2019/4/4 - Exploring Semantic Properties of Sentence Embeddings

    長岡技術科学大学 自然言語処理研究室 多田太郎
  2. Analysis -Sentence Modification Schemes-  変更された文を生成するために適用する変換の種類  ・Not-Negation  ・Quantifier-Negation  ・Synonym Substitution  ・Embedded

    Clause Extraction 7 ・Passivization ・Argument Reordering ・Fixed Point Inversion ・元の文Aの最初の動詞の前に否定マーカーを挿入 ・既に存在する場合は否定を削除します。 A: The young boy is climbing the wall made of rock. B: The young boy isn’t climbing the wall made of rock.
  3. Analysis -Sentence Modification Schemes-  変更された文を生成するために適用する変換の種類  ・Not-Negation  ・Quantifier-Negation  ・Synonym Substitution  ・Embedded

    Clause Extraction 8 ・Passivization ・Argument Reordering ・Fixed Point Inversion ・Aで始まる文の文頭にthere is noを追加 A: A girl is cutting butter into two pieces. B: There is no girl cutting butter into two pieces.
  4. Analysis -Sentence Modification Schemes-  変更された文を生成するために適用する変換の種類  ・Not-Negation  ・Quantifier-Negation  ・Synonym Substitution  ・Embedded

    Clause Extraction 9 ・Passivization ・Argument Reordering ・Fixed Point Inversion ・元の文の動詞を適切な同義語で置き換えて、新しい文Bを生成 A: The man is talking on the telephone. B: The man is chatting on the telephone.
  5. Analysis -Sentence Modification Schemes-  変更された文を生成するために適用する変換の種類  ・Not-Negation  ・Quantifier-Negation  ・Synonym Substitution  ・Embedded

    Clause Extraction 10 ・Passivization ・Argument Reordering ・Fixed Point Inversion ・以下のようなsayなどの動詞を含む文については、句を抽出する A: Octel said the purchase was expected. B: The purchase was expected.
  6. Analysis -Sentence Modification Schemes-  変更された文を生成するために適用する変換の種類  ・Not-Negation  ・Quantifier-Negation  ・Synonym Substitution  ・Embedded

    Clause Extraction 11 ・Passivization ・Argument Reordering ・Fixed Point Inversion ・能動態で表現されている文を受動態に A: Harley asked Abigail to bake some muffins. B: Abigail is asked to bake some muffins.
  7. Analysis -Sentence Modification Schemes-  変更された文を生成するために適用する変換の種類  ・Not-Negation  ・Quantifier-Negation  ・Synonym Substitution  ・Embedded

    Clause Extraction 12 ・Passivization ・Argument Reordering ・Fixed Point Inversion “<somebody> <verb> <somebody> to <do something>”という構造に一致す る文の場合、元の文Aの主語と目的語を入れ替えて、新しい文Bを生成 A: Matilda encouraged Sophia to compete in a match. B: Sophia encouraged Matilda to compete in a match.
  8. Analysis -Sentence Modification Schemes-  変更された文を生成するために適用する変換の種類  ・Not-Negation  ・Quantifier-Negation  ・Synonym Substitution  ・Embedded

    Clause Extraction 13 ・Passivization ・Argument Reordering ・Fixed Point Inversion ・文中の単語をピボットとして選択し、ピボットの前後で単語の順序を逆にする ・単語を共有しているが、意味が変化 A: A dog is running on concrete and is holding a blue ball B: concrete and is holding a blue ball a dog is running on.
  9. Analysis -Sentence Triplet Generation-  ・Negation Detection  ・Negation Variants    ・Clause

    Relatedness    ・Argument Sensitivity    ・Fixed Point Reorder   15
  10. Analysis -Sentence Triplet Generation-  3つの文からなる5つの評価データセットを作成  ・Negation Detection  Original sentence, Synonym

    Substitution, Not-Negation  ・Negation Variants  Quantifier-Negation,Not-Negation, Original sentence  ・Clause Relatedness  Original sentence, Embedded Clause Extraction, Not-Negation  ・Argument Sensitivity  Original sentence, Passivization, Argument Reordering  ・Fixed Point Reorder  Original sentence, Semantically equivalent sentence, Fixed Point Inversion 16 ・このデータセットでは、同義語置換を対比する文として使用 ・文の埋め込みが類似した構造と反対の意味を持つ文をどの程度うまく区別できるか ・原文と否定された文の間の類似性<原文と同義語バージョンの間の類似性が望ましい
  11. Analysis -Sentence Triplet Generation-  3つの文からなる5つの評価データセットを作成  ・Negation Detection  Original sentence, Synonym

    Substitution, Not-Negation  ・Negation Variants  Quantifier-Negation,Not-Negation, Original sentence  ・Clause Relatedness  Original sentence, Embedded Clause Extraction, Not-Negation  ・Argument Sensitivity  Original sentence, Passivization, Argument Reordering  ・Fixed Point Reorder  Original sentence, Semantically equivalent sentence, Fixed Point Inversion 17 ・文の埋め込みが否定数量詞をどの程度反映しているかを調べることが目的 ・Quantifier-NegationとNot-Negation間の類似性は、 Not-NegationまたはQuantifier-Negationと原文との間の類似性よりも少し高くなるはず
  12. Analysis -Sentence Triplet Generation-  3つの文からなる5つの評価データセットを作成  ・Negation Detection  Original sentence, Synonym

    Substitution, Not-Negation  ・Negation Variants  Quantifier-Negation,Not-Negation, Original sentence  ・Clause Relatedness  Original sentence, Embedded Clause Extraction, Not-Negation  ・Argument Sensitivity  Original sentence, Passivization, Argument Reordering  ・Fixed Point Reorder  Original sentence, Semantically equivalent sentence, Fixed Point Inversion 18 ・原文とその文の主な部分を抽出したものの類似性が 原文とその否定の間の類似性よりも高いかどうか
  13. Analysis -Sentence Triplet Generation-  3つの文からなる5つの評価データセットを作成  ・Negation Detection  Original sentence, Synonym

    Substitution, Not-Negation  ・Negation Variants  Quantifier-Negation,Not-Negation, Original sentence  ・Clause Relatedness  Original sentence, Embedded Clause Extraction, Not-Negation  ・Argument Sensitivity  Original sentence, Passivization, Argument Reordering  ・Fixed Point Reorder  Original sentence, Semantically equivalent sentence, Fixed Point Inversion 19 ・文の埋め込みが意味情報と構造情報を区別するのに成功するかどうか S : Lilly loves Imogen. S+ : Imogen is loved by Lilly. S∗ : Imogen loves Lilly.
  14. Analysis -Sentence Triplet Generation-  3つの文からなる5つの評価データセットを作成  ・Negation Detection  Original sentence, Synonym

    Substitution, Not-Negation  ・Negation Variants  Quantifier-Negation,Not-Negation, Original sentence  ・Clause Relatedness  Original sentence, Embedded Clause Extraction, Not-Negation  ・Argument Sensitivity  Original sentence, Passivization, Argument Reordering  ・Fixed Point Reorder  Original sentence, Semantically equivalent sentence, Fixed Point Inversion 20 ・文章の埋め込みが共通する単語より意味の近さを得られるか ・SICKデータセットから意味的関連性スコアと含意ラベル付けに従い文のペアを取得 ・2文の間の構造的類似性を確実にするため編集距離が十分に大きい文の対を選ぶ
  15. Analysis -Sentence Triplet Generation-  ・Negation Detection  ・Negation Variants    ・Clause

    Relatedness    ・Argument Sensitivity    ・Fixed Point Reorder   21