Disentangled Representation Learning for Non-Parallel Text Style Transfer

Disentangled Representation Learning for Non-Parallel Text Style Transfer ACL網羅的サーベイ報告会: Keito
Ishihara

自己紹介 • 石原慧人 • 筑波大B4 • Twitter: @nizhny_

論文概要 • NLPにおけるdisentanglingの研究 • 特にスタイル変換での利用を想定 • マルチタスク学習と敵対的学習を組み合わせた手法を提案タイトル雑日本語訳:教師なしテキストスタイル変換のための解きほぐされた表現学習

スタイル変換とは In CV: 同じ物体の画風を操作するタスク (例) Gatys+(CVPR2016) In NLP: テキストの意味(コンテンツ)を維持したまま、それ以外の情報(スタイル)を操作するタスク
(例)　私は猫です→我輩は猫である

「教師なし」テキストスタイル変換とは文to文で変換を行うので教師ありスタイル変換は翻訳系の手法がほぼそのまま使える　　主な研究対象はペアがない場合主流の手法 1. 入力文の特徴からコンテンツ成分を分離 2. スタイルを付与してデコードという手順で行う

Autoencoder AEで射影される中間表現を二つに分割し、それぞれの空間がスタイルとコンテンツを表現するよう補助損失を追加することで Disentanglementを行う

Style-Oriented Losses マルチタスク学習によりそれぞれの空間にその情報が含まれていることを、敵対的学習により余計な情報が含まれないことの保証を行う Multi-Task Loss for Style: スタイル空間から元々のスタイルを
当てるマルチタスク損失 Adversarial Loss for Style: コンテンツ空間から元々のスタイルを当てられないような敵対的損失

Content-Oriented Losses Multi-Task Loss for Content: コンテンツ空間から元々のコンテンツを当てるマルチタスク損失 Adversarial Loss
for Content: スタイル空間から元々のコンテンツを当てられないような敵対的損失 ※NLPではコンテンツとは何かが明確に定まらないことが多いが、ここでは事前に構築した辞書に基づくコンテンツワードのBoW 表現としている

訓練&推論手順訓練: 敵対的損失のためのそれぞれの Discriminatorの学習は個別に行い、それ以外の部分は全て同時に学習を行う推論: 「エンコーダで特徴空間に射影」→「コンテンツ空間のベクトルと学習時の目的スタイルの平均を結合」→「デコード」

実験: Disentangling Latent Space

実験:Non-Parallel Text Style Transfer

評価手法 • STA: 変換後テキストがスタイル分類モデルにどの程度意図したスタイルと分類されるか • CS: 変換元テキストと変換後テキストの文ベクトルのコサイン類似度 •
WO: コンテンツワードのみを抽出した変換元テキストと変換後テキストのuni-gram単語重複率 • PPL: 変換後テキストの学習済み言語モデルによるパープレキシティ • GM: STA, WO, 1/PPLの幾何平均

生成例

Disentangled Representation Learning for Non-Pa...

Disentangled Representation Learning for Non-Parallel Text Style Transfer

nizhny

More Decks by nizhny

Other Decks in Technology

Featured

Transcript