Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[論文解説] Unsupervised Learning of Style-sensitive...

Reon Kajikawa
January 29, 2024
2

[論文解説] Unsupervised Learning of Style-sensitive Word Vectors

ACL'18に採択された論文。CBOWによる教師なしスタイル埋め込みを提案した。

Reon Kajikawa

January 29, 2024
Tweet

More Decks by Reon Kajikawa

Transcript

  1. Unsupervised Learning of Style-sensitive Word Vectors Reina Akama, Kento Watanabe,

    Sho Yokoi, Sosuke Kobayashi, Kentaro Inui ACL 2018 URL:https://aclanthology.org/P18-2091/ 発表者:B4 梶川 怜恩
  2. テキストを分析し生成するためには2つの側面を捉える必要 • 何が言われているか(意味情報) • どのように言われているのか(スタイル情報)→ あまり研究されていない • スタイルを捉えることは下流タスクに役立つ [1,2] 2

    導入 [1] Wang et al.:Steering Output Style and Topic in Neural Response Generation (EMNLP’17) [2] Pavlick and Tetreault.:An Empirical Analysis of Formality in Online Communication(TACL’16)
  3. CBOW [4] • 幅δのウィンドウ内で中心の単語を予測 • 意味的・構文的な類似性を考慮したベクトルを作成 • 単語ベクトル と𝑣𝑐 ∈

    𝐶𝑤𝑡 𝑛𝑒𝑎𝑟を学習 • CBOW-NEAR-CTXと呼ぶことにする 5 ベースライン(CBOW-NEAR-CTX) [4] Mikolov et al.:Efficient Estimation of Word Representations in Vector Space(ICLR’13)
  4. CBOW-DIST-CTX • 近傍文脈を学習する → スタイル以外の情報を考慮してしまう • 全文脈𝐶𝑤𝑡 𝑎𝑙𝑙から近傍文脈𝐶𝑤𝑡 𝑛𝑒𝑎𝑟を除外する →

    遠い単語のみを学習時に使用 → スタイルのみを捉えた単語ベクトルの取得 8 スタイルのみを学習(CBOW-DIST-CTX)
  5. モデル 1. CBOW-NEAR-CTX • 近くの単語のみを考慮 2. CBOW-ALL-CTX • 幅δを文全体に拡張(文に含まれるすべての単語を見る) 3.

    CBOW-DIST-CTX • 遠くの単語のみを考慮(スタイルを学習) 4. CBOW-SEP-CTX • 近くの単語、遠くを見る場合の両方を考慮 • スタイルベクトル𝑥と意味/構文ベクトル𝑦に分離して学習 10 学習手法まとめ