Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

[論文解説] Disentangled Learning with Synthetic Par...

Reon Kajikawa
November 06, 2024
4

[論文解説] Disentangled Learning with Synthetic Parallel Data for Text Style Transfer

Reon Kajikawa

November 06, 2024
Tweet

More Decks by Reon Kajikawa

Transcript

  1. Disentangled Learning with Synthetic Parallel Data for Text Style Transfer

    Jingxuan Han, Quan Wang, Zikang Guo, Benfeng Xu,Licheng Zhang, Zhendong Mao ACL 2024 URL:https://aclanthology.org/2024.acl-long.811/ 発表者:M1 梶川 怜恩
  2. スタイル変換の課題 • 学習データが不足している • 教師なし学習手法として分離学習 • 教師信号がない → 意味の保持ができていないことが問題 提案手法

    • 合成データを用いた分離学習の提案 • 合成データ:パラレルコーパスをLLMで生成 • 分離学習 :意味の保持とスタイル制御を目的とする損失の設計 1 概要
  3. 文は意味とスタイルを表す部分に直接分割できる? • 文=意味属性+スタイル属性 4 アイデア:新しい分離概念の提案 very good food and service!

    food and service! very good very bad food and service! スタイル属性のみ 変換するだけでいい 意味が保持しやすい
  4. 長さ𝑙の文: ෡ 𝑘𝑙 件 長さの文: ෢ 𝑘2 件 長さの文: ෢

    𝑘1 件 k 意味を保持しているか? • BLEUで意味保持を測定 • モデルが多様な文長のスタイル変換の能力を獲得できる • 文長に基づいてグルーピングする。グループごとに上位からサンプリング 10 ② 合成文をフィルタリングするエラー検出器 *https://huggingface.co/textattack/bert-base-uncased-yelp-polarity *https://huggingface.co/JiaqiLee/imdb-finetuned-bert-base-uncased BLEU値を算出 各グループごとにソート 上位 ෡ 𝑘𝑙 = ෡ 𝑁 × 𝑘𝑙 𝑁 件選択 長さ1の文:3件 長さ2の文:5件 長さ𝑙の文:𝑘𝑙 件 N 件 ෡ 𝑁件
  5. 右から順に合成データを構築する 11 合成データの生成手順をまとめると… LLM 分類器 エラー 検出器 Input Sentence 𝑥

    Input Sentence 𝑥 Input Sentence 𝑥 Input Sentence 𝑥 ①CoTで合成文を自動生成 ②合成文が期待する スタイルに変換されているか? ③合成文が元の文と比べて 意味を保持しているか?
  6. 分離学習手法の概要図 13 分離学習手法の概要図 ①原文と合成文の 文ぺアを入力 ②各文をテンプレT に組み込む 𝑇(𝑥, Ƹ 𝑠):

    “Transfer ‘It tastes delicious’ to negative style.” ③計算資源のため prefix-tuning ④2つの損失で スタイルと意味保持を学習 文とスタイル属性 セットで入力
  7. 自動評価 • スタイル制御 • S-ACC:訓練データで感情分類器を構成。出力ラベルを正解ラベルとする。 • 意味保持 • ref-BLEU :出力文と参照文との類似度(=BLEU)

    • self-BLEU:入出力文の類似度 • 総合評価 • G-Score:S-ACCとself-BLEUの幾何平均(n√a1*a2…an) 人手評価 • 出力文を評価 • スタイル制御(SC)、意味保持(SP)、流暢性(FL) • 5段階評価 • 3人の平均スコアを最終スコアにした 17 実験設定:評価について
  8. × エラー検出器(EDM) • 直接生成されたデータで訓練したものと比較 • 合成データの品質の向上に貢献している × 対照損失(ConLoss) • Seq2seq

    Lossのみで訓練したものと比較 • 対照損失がスタイル制御に貢献している 21 分析:アブレーション分析