Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介[Zero-Shot Dialog Generation with Cross-Domain Latent Action]
Search
Ayumu
February 18, 2019
Technology
0
150
文献紹介[Zero-Shot Dialog Generation with Cross-Domain Latent Action]
長岡技術科学大学 自然言語処理研究室
学部3年 守谷 歩
Ayumu
February 18, 2019
Tweet
Share
More Decks by Ayumu
See All by Ayumu
B3ゼミ_03_28_マルチモーダル学習_.pdf
ayumum
0
140
マルチモーダル学習
ayumum
0
120
B3ゼミ 自然言語処理におけるCNN
ayumum
0
84
言語処理年次大会報告
ayumum
0
72
ニューラルネット4
ayumum
0
95
文献紹介「二値符号予測と誤り訂正を用いたニューラル翻訳モデル」
ayumum
0
130
ニューラルネット3 誤差伝搬法,CNN,word2vec
ayumum
0
160
ニューラルネット実践
ayumum
0
96
パーセプトロンとニューラルネット1
ayumum
0
100
Other Decks in Technology
See All in Technology
**強い**エンジニアのなり方 - フィードバックサイクルを勝ち取る / grow one day each day
soudai
61
18k
レガシーをぶっ壊せ。AEONで始めるDevRelの話 / Qiita Night 2024-2-22
aeonpeople
3
150
なぜ NOT A HOTEL が Web3 に取り組むのか - NOT A HOTEL TECH TALK
ynunokawa
0
160
「共通基盤」を超えよ! 今、Platform Engineeringに取り組むべき理由
jacopen
25
5.9k
TransitGatewayの基礎
toru_kubota
0
230
Next'24 事例セッションの紹介とクラウド資格を活用したキャリア形成について語りMuscle
yasumuusan
1
350
WebアプリケーションにおけるPDOの使い方入門 / phpcon odawara 2024
meihei3
2
430
0→1開発における技術選定において一番大切なこと
bicstone
1
330
[2024年3月版] Databricksのシステムアーキテクチャ
databricksjapan
8
1.9k
Vertex AI を中心に 生成AIのアップデートを共有します
kaz1437
0
150
20240416_devopsdaystokyo
kzkmaeda
1
190
テストプロセスで大事にしていること #jasstnano
makky_tyuyan
0
130
Featured
See All Featured
Statistics for Hackers
jakevdp
789
220k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
186
16k
Infographics Made Easy
chrislema
237
18k
Navigating Team Friction
lara
177
13k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
226
16k
GitHub's CSS Performance
jonrohan
1023
450k
Being A Developer After 40
akosma
56
580k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
6
990
Designing Dashboards & Data Visualisations in Web Apps
destraynor
226
51k
What's new in Ruby 2.0
geeforr
337
31k
Designing Experiences People Love
moore
136
23k
Fireside Chat
paigeccino
20
2.6k
Transcript
Zero-Shot Dialog Generation with Cross-Domain Latent Action 2019/02/18 長岡技術科学大学 自然言語処理研究室
学部3年 守谷 歩
Literature ⚫“Zero-Shot Dialog Generation with Cross-Domain Latent Actions ⚫Tiancheng Zhao
and Maxine Eskenazi ⚫Proceedings of the SIGDIAL 2018 Conference, pages 1– 10,Melbourne, Australia, 12-14 July 2018.c©2018 Association for Computational Linguistics
Abstract ⚫E2E(End to End)のタスク型、非タスク型対話システムの強力なフ レームワークとしてダイアログ応答生成であるGEDM(Generatuce End- to-end Dialog Model)といったモデルがある。
Abstract ⚫GEDMの問題点として、大量の学習データを必要とする点がある ⚫GEDMをより柔軟にし、1つのモデルに対して同時に多くのドメイン の学習を行う(マルチタスク) ⚫データありの関連しているドメインから、データなしの新規のドメイ ンに情報を付与する(Zero-Shot)
Zero shot Dialog Generation(ZSDG)の設定 ⚫対話コンテキストc,応答x,ドメインdとし、データを{c,x,d}とする。 ⚫このZSDGモデルはc,dが与えられ、xを出力するように学習する。 ⚫このモデルのゴールとして未知のターゲットドメインをソースドメイ ンに関連付けし,c*d→xを学習する。
Seed Response (SR) ⚫SR(d)をタプルとして定義する。 ⚫各タプルはドメインに対して注釈がついている:{x,a,d} ⚫この時xは対話の例、aは注釈、dはドメインである
AM(Aciton Matching)アルゴリズム
ロス最適化 ⚫ZからXへのロス関数Ldd(ドメインを入力としたもの) ⚫対話のロス関数Ldialog
実験モデル詳細 ⚫認識用ネットワークR:双方向GRU ⚫エンコーダFe:階層型リカレントLSTMエンコーダ(HRE)[Li et al 2015] ⚫デコーダFd: ⚫LSTM 注釈デコーダ ⚫LSTM
PSM(Pointer-sentinel Mixture)デコーダ[Merity et al 2016]
LSTM PSMデコーダを使った実装
学習のデータセット ⚫CMU Sim Dial: Simulated dataset ⚫Stanford Multi-domain Dialog(SMD) Dataset:
Human-Woz dataset
実験結果
結果の測定と比較モデル ⚫BLEU-4:今回生成された応答~参照間のコーパスレベル ⚫Entity F1:生成された応答に正しいエンティティが付与されているか の確認 ⚫Act F1:生成された応答が正しい動作をするかどうか ⚫KB F1:生成されたAPIに正しいトークンが含まれているかの確認 ⚫BEAK:上記4つの相乗平均:BEAK=(bleu*ent*act*kb)^(1/4)
⚫BE(for SMD) BE=(bleu*ent)^(1/2)
結果からの分析
結果からの分析 SR
Conclusion ⚫対話生成システムに対する手法としてZSDGを提案した。 ⚫また、対話情報の共有がレベル的にパターンを持つといった仮定 の下、SRを持つAMアルゴリズムの提案を行った。 ⚫これらのアルゴリズムは、合成されたデータセットや実際のデータ セットの両方での有用性が確認された。