Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Style Transfer Through Back-Transhlation

Style Transfer Through Back-Transhlation

研究室の論文読み会の資料です。

ryoma yoshimura

November 12, 2018
Tweet

More Decks by ryoma yoshimura

Other Decks in Research

Transcript

  1. Introduction • スタイル変換とは ◦ テキストの意味を変えることなく、特定の文体特性を含むようにテキストを言い 換えるタスク • 機械翻訳や対話などの言語生成タスクで出力を制御することは重要 ◦ 例

    ▪ “Shut up! the video is starting!” 友達とのパーティーにて ▪ “Please be quiet, please.”   職場にて • 最近研究されているスタイル変換の手法はヒューリスティックな手法と比べて優れ ているが、文の意味を効果的に保つことは示されていない
  2. Method: Overview 1. スタイル変換したい文を翻訳 2. 1の出力を逆方向の翻訳機に入れる 3. Encoderの出力を 潜在表現 Z

    として使用 4. ZをそれぞれのスタイルのDecoderに入れてスタイル変換する republication(共和党) democratic(民主党)
  3. Method: Generator Learning • 生成したいスタイルに合わせて複数の Decoder を学習 • Decoder の出力を分類器に入れて

    Loss をフィードバックして学習 • decoder は global attention 付きの bidirectionla LSTM
  4. Method: Style Classifiers • ラベル付きデータを使ってCNN分類器を pretrain する • 分類器の性能を上げるために、入力単語の Embedding

    に binary style indicators を concat する ◦ 単語がスタイル特有の語彙なら 1にセット、そうでなければ 0
  5. Related Work • Toward controlled generation of text. Hu et

    al., ICML2017 ◦ VAEとdiscriminatorを用いたスタイル変換の手法を提案 ◦ sentiment と tense にフォーカス ◦ 意味の保持性は評価していない • Style transfer from non-parallel text by cross-alignment. Shen et al., NIPS2017 ◦ cross-alignment auto-encodersとdiscriminatorを用いた手法を提案 ◦ sentiment と 単語置換による暗号の解読にフォーカス
  6. Style Transfer Task 1 • Gender ◦ 文の書き手の性別を変えるような文に変換するタスク ◦ Reddy

    and Knight(2016)がヒューリスティックな手法を提案 ▪ 性別に関連するような単語を、別の性別の類義語に置換する ▪ 高い流暢性と意味の保持 ▪ ただの単語の置き換えで、それ以上の変化はできない ◦ Reddy and Knight(2016)と同じデータセットを使用 ▪ 性別ラベル付きのYelpのレビュー ▪ ナチュラルな文と、特定の性別っぽさが 0.7 未満の文をフィルター
  7. Style Transfer Task 2 • Political slant ◦ 文の政治的傾きを変えるように文を変換するタスク ◦

    412 人の米国議員がFacebookに投稿したコメントのデータセットを使用 ◦ democratic (民主党)か republican(共和党)のラベルが付いている ▪ democraticの例 • on behalf of the hard-working nh public school teachers- thank you ! • we need more strong voices like yours fighting for gun control . ▪ republicanの例 • defund them all, especially when it comes to the illegal immigrants . • thank u james, praying for all the work u do .
  8. Style Transfer Task 3 • Sentiment ◦ 文の感情を変えるように文を変換するタスク ◦ Yelpのレビューのデータセット

    ▪ 評価4以上がポジティブ、評価2以下がネガティブ ▪ レビューを文に分割、その文がレビューと同じ Sentiment と仮定
  9. Experimental Setup • Baseline ◦ “cross-aligned” auto-encoder (Shen et al.,

    2017) • Translation data ◦ Europarl v7, v10などのWMT15にあるEn-Fr, Fr-ENのデータでMTを学習 ◦ 学習データは 5.4M で vocab sizeは100K • Hyperparameter settings ◦ generator と Encoderは 2層のbidirectional LSTM ▪ embedding size 300, hidden size 500 ◦ CNN分類器 ▪ filter num 100, filter size 5 ▪ input embedding size 300 + 2(binary style indicators)
  10. Experimental Setup • Translation quality ◦ BLEU En-Fr : 32.52, Fr-En

    : 31.11 ◦ 膨大なデータが利用できてスコアが高くなるような言語を故意に選択 ◦ モデルの性能や言語選択がどう影響するかは調べていない • 評価方法 ◦ スタイル変換の精度 ▪ 分類器で評価 ◦ 意味の保持性(A/Bテスト) ▪ 元の文と比べて意味が同じ方を選んでもらう ▪ base line と提案手法が同じくらい悪いか良い場合は “No pref” ◦ 流暢性(人手) ▪ ランダムな60文に対して1(unreadable)~ 4(perfect)
  11. Results • 分類器の精度 ◦ Gender 82 % ◦ Political slant

    92% ◦ Sentiment 93.23% • スタイル変換の精度 ◦ Gender以外は提案手法の方が良い CAE: Cross-aligned Auto-Encoder BST: Back-Translation for Style Transfer
  12. Discussion • sentimentタスクでは意味の保持でベースラインよりも提案手法が悪かった ◦ sentiment タスクはスタイル変換の評価にあまり適していないタスク ▪ 文の意味を保ったまま sentiment を変えるのは特に難しい

    • gender タスクではスタイル変換の精度でベースラインよりも提案手法の方が悪 かったが、意味の保持では提案手法の方が良かった ◦ 提案手法は、精度は少し低くてもいいが意味の保持を大切にしたいときに有 効である