文献紹介:Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding 鈴木脩右 2019/2/14
長岡技術科学大学自然言語処理研究室 1

目次概要背景 MT-DNN モデル実験タスク実験結果まとめ 2

概要

概要 • MT-DNN(Multi-Task Deep Neural Network) というモデルを提案 • 複数の言語理解
(NLU) タスクにわたり，言語表現を学習 • 10 個の NLU タスクで SotA を達成 • 少ないトレーニングデータで高い精度を示した 3

背景

背景 • NLU タスクには 2 つのアプローチがある • Multi-Task Learning (MTL)
• Laguage Model Pre-traning • MT-DNN は両方の強みを併せることを目指した 4

Multi-Task Learning (MTL) • 別のタスクで得た知識を他のタスクにも利用 • 多くの関連タスクから教師データを効果的に活用できる • 学習した言語表現をタスク全体で普遍的に用いることができる
5

Laguage Model Pre-traning • 教師なしデータで言語表現を事前学習 • モデルの微調整をし，追加学習することで別タスクに適用できる • 例として，BERT，ELMo
が挙げられる 6

MT-DNNモデル

MT-DNNモデル Figure 1: Architecture of the MT-DNN model for representation
learning.[1] 7

実験タスク

実験タスク i 1. Single-Sentence Classification 1 つの文で判定するタスク 2. Text Similarity
2 つの文が表す感情が類似しているか判定するタスク 3. Pairwise Text Classification 2 つの文の含意や，意味が一致するか判定するタスク 4. Relevance Ranking 質問応答タスク 8

実験タスク ii Table 1: Summary of the three benchmarks: GLUE,
SNLI and SciTail.[1] 9

実験結果

実験結果 i Table 2: GLUE test set results, which are
scored by the GLUE evaluation server.[1] 10

実験結果 ii Table 3: Results on the SNLI and SciTail
dataset.[1] 11

実験結果 iii Figure 2: Domain adaption results on SNLI and
Sci-Tail.[1] Table 4: Domain adaptation results on SNLI and Scitail.[1] 12

まとめ

まとめ • Multi-Task Learning (MTL) と Laguage Model Pre-traning を
組み合わせ，MT-DNN の言語表現を学習した • 幅広いタスクで高い成果を出した • MTL のモデル構造の理解を深めることで，MT-DNN を改善できると考えられる 13

参考文献 [1] Xiaodong Liu, Pengcheng He, Weizhu Chen, and Jianfeng
Gao. Multi-Task Deep Neural Networks for Natural Language Understanding. arXiv:1901.11504 [cs], January 2019. 14

文献紹介:Multi-Task Deep Neural Networks for Natural Language Understanding

文献紹介:Multi-Task Deep Neural Networks for Natural Language Understanding

shu_suzuki

More Decks by shu_suzuki

Other Decks in Technology

Featured

Transcript

Multi-Task Deep Neural Networks for Natural Language Understanding 鈴木脩右 2019/2/14

目次概要背景 MT-DNN モデル実験タスク実験結果まとめ 2

概要

概要 • MT-DNN(Multi-Task Deep Neural Network) というモデルを提案 • 複数の言語理解

背景

背景 • NLU タスクには 2 つのアプローチがある • Multi-Task Learning (MTL)

Multi-Task Learning (MTL) • 別のタスクで得た知識を他のタスクにも利用 • 多くの関連タスクから教師データを効果的に活用できる • 学習した言語表現をタスク全体で普遍的に用いることができる

Laguage Model Pre-traning • 教師なしデータで言語表現を事前学習 • モデルの微調整をし，追加学習することで別タスクに適用できる • 例として，BERT，ELMo

MT-DNNモデル

MT-DNNモデル Figure 1: Architecture of the MT-DNN model for representation

実験タスク

実験タスク i 1. Single-Sentence Classification 1 つの文で判定するタスク 2. Text Similarity

実験タスク ii Table 1: Summary of the three benchmarks: GLUE,

実験結果

実験結果 i Table 2: GLUE test set results, which are

実験結果 ii Table 3: Results on the SNLI and SciTail

実験結果 iii Figure 2: Domain adaption results on SNLI and

まとめ

まとめ • Multi-Task Learning (MTL) と Laguage Model Pre-traning を

参考文献 [1] Xiaodong Liu, Pengcheng He, Weizhu Chen, and Jianfeng