「深層学習による自然言語処理」読書会第5章5.1

ࣗݾ঺հ • 名前：⽩⼟慧 • 年齢：33歳 • 所属：株式会社レトリバ（2016年4⽉〜） • 職業：エンジニア
• ⾃然⾔語処理：⼤学の授業レベル。 • 深層学習：⼊社してから少しだけ案件で。 © 2017 Retrieva, Inc. 2

<એ఻> • WEB+DB PRESS Vol.100 に、弊社のメンバーが特集記事を書きました。 • 特集1
作って学ぶ⼈⼯知能 • 第1章⼈⼯知能とはどんな技術なのか？ • 第2章⾃然⾔語処理 • 第3章機械学習 • 第4章深層学習とニューラルネットワーク • 明⽇ 8/24 発売！ © 2017 Retrieva, Inc. 3

ൣғ • 5.1. 機械翻訳 • 5.1.1 「統計」翻訳と「ニューラル」翻訳 • 5.1.2 典型的なモデル構成
• 5.1.3 ⼊出⼒の処理単位/未知語に対する改良 • 5.1.4 被覆に対する改良 • 5.1.5 今後の発展 • 付録: GitHub に公開された Chainer による NMT の実装 © 2017 Retrieva, Inc. 4

ʮ౷ܭʯ຋༁ͱʮχϡʔϥϧʯ຋༁ • ニューラル翻訳(NMT) • 系列変換モデルのように、1つのニューラルネットで翻訳モデルを構成するような機械翻訳⽅式 • 統計翻訳(SMT)との対⽐として使われる⽤語。最近では系列変換モデルを使った機械翻訳の総称として使われるようになった •
WMT15,16でニューラル翻訳システムが統計翻訳システムを⼤きく上回った • この章では、2017年1⽉時点でのベースライン技術に絞って解説 © 2017 Retrieva, Inc. 5

యܕతͳϞσϧߏ੒ • 注意機構付き系列変換モデルが、ニューラル翻訳を含めた機械翻訳のベースラインと考えられるようになってきた • GroungHog(RNNSearch) • 現在メンテナンスは終了 • GroungHog
は⼆種類あるが、RNNSearch は注意機構付き • OpenNMT • 現時点で速度、メモリ使⽤量、最終的な翻訳精度で優れていると⾔われる • 本節ではOpenNMTで採⽤されているモデルを解説する © 2017 Retrieva, Inc. 6

యܕతͳϞσϧߏ੒ • 符号化部分 • 2層双⽅向LSTM • 復号化部分 • 2層LSTM •
注意機構 © 2017 Retrieva, Inc. 7

యܕతͳϞσϧߏ੒ʢ෮߸Խ෦෼ɺධՁ࣌ʣ • 正解がわからないので、前の時刻 j-1 の予測を利⽤して j の予測を⾏う •
EOSが出⼒されるまで繰り返す • ビーム探索を⽤いて処理を⾏うことが多い © 2017 Retrieva, Inc. 10

ೖग़ྗͷॲཧ୯Ґະ஌ޠʹର͢Δվྑ • 扱う語彙数を多くすると計算量が⼤きくなりすぎ、精度も低下する • ニューラル翻訳では統計翻訳より語彙数が少ないのが現状 • 未知語をどう扱うかも課題 • 統計翻訳を踏襲して、未知語を後処理で何かの語に置き換える⼿法も
ある © 2017 Retrieva, Inc. 11

ೖग़ྗͷॲཧ୯Ґະ஌ޠʹର͢Δվྑ • 「単語」ではなく「⽂字」を単位にする⽅法 • ⽂字数は多くても数1000⽂字で収まるので、簡単になる • ⼀⽅、系列⻑は圧倒的に⻑くなるので、予測誤りが多くなる • トレードオフの⾒極めはまだ •
バイト対符号化 • 前処理として、⼀定の語彙数になるまで、出現頻度が⼤きい⽂字ペアを１つの⽂字としてまとめていく © 2017 Retrieva, Inc. 12

ඃ෴ʹؔ͢Δվྑ • ニューラル翻訳の既知の弱点 • 繰り返し⽣成する、過剰⽣成問題(Over-generation) • 必要な語やフレーズを無視する、不⾜⽣成問題(Under-generation) • 被覆(Coverage)概念を導⼊する •
統計翻訳時代には普通に使われていた • 注意機構で計算される注意確率の合計が、復号化器の処理が終わった際に何らかの値（全て1のベクトルなど）になるよう学習させる © 2017 Retrieva, Inc. 13

「深層学習による自然言語処理」読書会第5章5.1

「深層学習による自然言語処理」読書会第5章5.1

Kei Shiratsuchi PRO

More Decks by Kei Shiratsuchi

Other Decks in Technology

Featured

Transcript

ʮਂ૚ֶशʹΑΔࣗવݴޠॲ ཧʯಡॻձ ୈষ ⽩⼟慧株式会社レトリバ © 2017 Retrieva, Inc.

ࣗݾ঺հ • 名前：⽩⼟慧 • 年齢：33歳 • 所属：株式会社レトリバ（2016年4⽉〜） • 職業：エンジニア

<એ఻> • WEB+DB PRESS Vol.100 に、弊社のメンバーが特集記事を書きました。 • 特集1

ൣғ • 5.1. 機械翻訳 • 5.1.1 「統計」翻訳と「ニューラル」翻訳 • 5.1.2 典型的なモデル構成

యܕతͳϞσϧߏ੒ • 注意機構付き系列変換モデルが、ニューラル翻訳を含めた機械翻訳のベースラインと考えられるようになってきた • GroungHog(RNNSearch) • 現在メンテナンスは終了 • GroungHog

యܕతͳϞσϧߏ੒ • 符号化部分 • 2層双⽅向LSTM • 復号化部分 • 2層LSTM •

యܕతͳϞσϧߏ੒ʢූ߸Խ෦෼ʣ © 2017 Retrieva, Inc. 8

యܕతͳϞσϧߏ੒ʢ෮߸Խ෦෼ɺֶश࣌ʣ © 2017 Retrieva, Inc. 9

యܕతͳϞσϧߏ੒ʢ෮߸Խ෦෼ɺධՁ࣌ʣ • 正解がわからないので、前の時刻 j-1 の予測を利⽤して j の予測を⾏う •

ඃ෴ʹؔ͢Δվྑ • ニューラル翻訳の既知の弱点 • 繰り返し⽣成する、過剰⽣成問題(Over-generation) • 必要な語やフレーズを無視する、不⾜⽣成問題(Under-generation) • 被覆(Coverage)概念を導⼊する •

ࠓޙͷൃల オレはようやく登りはじめたばかりだからな。このはてしなく遠いNMT坂をよ… © 2017 Retrieva, Inc. 14

෇࿥(JU)VCʹެ։͞Εͨ $IBJOFS ʹΑΔ /.5 ͷ࣮૷ • https://github.com/mlpnlp/mlpnlp-nmt © 2017 Retrieva,

「深層学習による自然言語処理」読書会 第5章5.1

「深層学習による自然言語処理」読書会 第5章5.1

More Decks by Kei Shiratsuchi

Other Decks in Technology

Featured

Transcript

「深層学習による自然言語処理」読書会第5章5.1

「深層学習による自然言語処理」読書会第5章5.1