Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[論文解説] Sentence Representations via Gaussian Em...

Reon Kajikawa
January 29, 2024
2

[論文解説] Sentence Representations via Gaussian Embedding

EACL'24に採択された論文。GaussCSEを提案。

Reon Kajikawa

January 29, 2024
Tweet

More Decks by Reon Kajikawa

Transcript

  1. Sentence Representations via Gaussian Embedding Shohei Yoda, Hayato Tsukagoshi, Ryohei

    Sasano, Koichi Takeda EACL 2024 発表者:B4 梶川 怜恩
  2. 類似度指標の性質 文𝒔𝟏 の分散 > 文𝒔𝟐 の分散であるとき、 𝒔𝒊𝒎(𝒔𝟏 ||𝒔𝟐 )< 𝒔𝒊𝒎(𝒔𝟐

    ||𝒔𝟏 )となる傾向(性質 ②) 𝑠1 が𝑠2 を包含している際… • 𝒔𝒊𝒎(𝒔𝟏 ||𝒔𝟐 )を小さく、 𝒔𝒊𝒎(𝒔𝟐 ||𝒔𝟏 )を大きくするよう学習 → 文𝑠1 の分散が大きく、文𝑠2 の分散が小さくなることが期待される → 包含関係の学習の実現 10 GaussCSE:類似度指標の性質
  3. 学習手法 • 教師あり対照学習 • NLIデータセットを訓練データとする 正例と負例の選定法 • 含意集合(正例) • 含意ラベルの文ペアの集合

    • 意味的に類似しているので、simを大きくなるように学習 • 矛盾集合(負例) • 矛盾ラベルの文ペアの集合 • 意味的に非類似なので、simを小さくなるように学習 • 逆向き集合(負例) • 含意集合の文ペアを入れ替えた集合 • simの性質上、simを小さくなるように学習 11 GaussCSE:学習手法 sim(含意*||前提)を大きく sim(前提||含意)を小さくして 包含関係を学習 *含意=仮説
  4. 文埋め込みの評価 • NLI分類タスク • 包含の向き推定タスク データセット • SNLIデータセット+MNLIデータセット 比較実験 •

    教師ありSimCSE • 3つの集合のうち一部を除いて学習したモデルでも評価 13 評価実験
  5. 包含の向き推定 • 包含関係を捉えているかを評価 • 含意関係にある文ペアに対して、どちらが含意する文なのか推定 推定方法 • 類似度ベース: 𝒔𝒊𝒎(𝒔𝟏 |

    𝒔𝟐 < 𝒔𝒊𝒎(𝒔𝟐 ||𝒔𝟏 )ならば、𝑠1 を包含する側とする • 分類ベース :det(𝜎1 ) > det(𝜎2 )ならば、 𝑠1 を包含する側とする データセット • SNLIとSICK 16 評価実験2:包含の向き推定