「深層学習による自然言語処理」読書会第5章5.1

by Kei Shiratsuchi

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

ʮ౷ܭʯ຋༁ͱʮχϡʔϥϧʯ຋༁ • ニューラル翻訳(NMT) • 系列変換モデルのように、1つのニューラルネットで翻訳モデルを構成するような機械翻訳⽅式 • 統計翻訳(SMT)との対⽐として使われる⽤語。最近では系列変換モデルを使った機械翻訳の総称として使われるようになった • WMT15,16でニューラル翻訳システムが統計翻訳システムを⼤きく上回った • この章では、2017年1⽉時点でのベースライン技術に絞って解説 © 2017 Retrieva, Inc. 5

Slide 6

Slide 6 text

యܕతͳϞσϧߏ੒ • 注意機構付き系列変換モデルが、ニューラル翻訳を含めた機械翻訳のベースラインと考えられるようになってきた • GroungHog(RNNSearch) • 現在メンテナンスは終了 • GroungHog は⼆種類あるが、RNNSearch は注意機構付き • OpenNMT • 現時点で速度、メモリ使⽤量、最終的な翻訳精度で優れていると⾔われる • 本節ではOpenNMTで採⽤されているモデルを解説する © 2017 Retrieva, Inc. 6

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

ඃ෴ʹؔ͢Δվྑ • ニューラル翻訳の既知の弱点 • 繰り返し⽣成する、過剰⽣成問題(Over-generation) • 必要な語やフレーズを無視する、不⾜⽣成問題(Under-generation) • 被覆(Coverage)概念を導⼊する • 統計翻訳時代には普通に使われていた • 注意機構で計算される注意確率の合計が、復号化器の処理が終わった際に何らかの値（全て1のベクトルなど）になるよう学習させる © 2017 Retrieva, Inc. 13

Slide 14

Slide 14 text

Slide 15

Slide 15 text