Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Dialogue-act-driven Conversation Model: An Expe...
Search
shu_suzuki
February 25, 2019
Technology
0
86
Dialogue-act-driven Conversation Model: An Experimental Study
長岡技術科学
自然言語処理研究室
鈴木脩右
文献紹介
shu_suzuki
February 25, 2019
Tweet
Share
More Decks by shu_suzuki
See All by shu_suzuki
文献紹介:Investigating Evaluation of Open-Domain Dialogue Systems With Human Generated Multiple References
shu_suzuki
0
190
文献紹介:Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study
shu_suzuki
0
84
文献紹介: How to Make Context More Useful? An Empirical Study on Context-Aware Neural Conversational Models
shu_suzuki
0
340
文献紹介:Conversational Response Re-ranking Based on Event Causality and Role Factored Tensor Event Embedding
shu_suzuki
0
170
文献紹介:Modeling Semantic Relationship in Multi-turn Conversations with Hierarchical Latent Variables
shu_suzuki
0
77
文献紹介:ReCoSa: Detecting the Relevant Contexts with Self-Attention for Multi-turn Dialogue Generation
shu_suzuki
0
210
文献紹介:Better Automatic Evaluation of Open-Domain Dialogue Systems with Contextualized Embeddings
shu_suzuki
0
120
文献紹介:Why are Sequence-to-Sequence Models So Dull?
shu_suzuki
0
70
文献紹介:Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network
shu_suzuki
0
220
Other Decks in Technology
See All in Technology
SRE Enabling戦記 - 急成長する組織にSREを浸透させる戦いの歴史
markie1009
0
130
AIと新時代を切り拓く。これからのSREとメルカリIBISの挑戦
0gm
1
2.9k
顧客との商談議事録をみんなで読んで顧客解像度を上げよう
shibayu36
0
260
Amazon Bedrock Knowledge Basesチャンキング解説!
aoinoguchi
0
160
usermode linux without MMU - fosdem2026 kernel devroom
thehajime
0
240
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
450
AIエージェントに必要なのはデータではなく文脈だった/ai-agent-context-graph-mybest
jonnojun
0
140
コンテナセキュリティの最新事情 ~ 2026年版 ~
kyohmizu
2
160
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
[CV勉強会@関東 World Model 読み会] Orbis: Overcoming Challenges of Long-Horizon Prediction in Driving World Models (Mousakhan+, NeurIPS 2025)
abemii
0
140
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
320
会社紹介資料 / Sansan Company Profile
sansan33
PRO
15
400k
Featured
See All Featured
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
1.9k
New Earth Scene 8
popppiees
1
1.5k
Are puppies a ranking factor?
jonoalderson
1
2.7k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
210
Six Lessons from altMBA
skipperchong
29
4.2k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
440
WENDY [Excerpt]
tessaabrams
9
36k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
Bash Introduction
62gerente
615
210k
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Site-Speed That Sticks
csswizardry
13
1.1k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
67
Transcript
文献紹介 Dialogue-act-driven Conversation Model: An Experimental Study 鈴木脩右 2019/2/25 長岡技術科学大学
自然言語処理研究室 1
Reference [1] Harshit Kumar, Arvind Agarwal, and Sachindra Joshi. Dialogue-act-driven
Conversation Model : An Experimental Study. In Proceedings of the 27th International Conference on Computational Linguistics, pages 1246–1256, Santa Fe, New Mexico, USA, August 2018. Association for Computational Linguistics. 2
Abstract • 発話選択において,対話行為情報を追加することの有用性 に関する研究 • seq2seq encoder-decoder モデル,階層的 encoder-decoder モデルなどモデルに関係なく性能が向上
• 階層的 encoder を利用した新しいモデルを構築 • DailyDialog dataset において,MRR で約 84.4%を達成し, baseline より優れた性能を持つ 3
Introduction i • 応答予測は2つの方法で定式化可能 • 純粋な発話の生成 • 発話候補からの選択 (本論文ではこちらを使用) •
発話選択タスクのモデルは 2 種類 • 生成モデル (seq2seq モデル) - 与えられた文脈で応答を生成 • 識別モデル (Siamese モデル) - 文脈から適切,不適切な応答を識別 • 対話行為とは,話し手の意図を表わす抽象的概念のこと 4
Introduction ii • 本研究での貢献は以下の 4 つ • 発話選択タスクにおいて,対話行為情報がモデルに関係なく有効 であることの検証 •
Siamese network,対話固有の階層構造,それぞれの長所を組み 合わせた新モデルを提案 • 対話行為情報の有用性について,以下の観点から考察 • モデルは有効な対話行為を学習するか • 対話行為は統一性をもたらすか • 対話行為はモデルが正しいパターンの学習を補助するか • DailyDialog dataset を,発話選択タスクに合わせて修正 5
生成モデル • ED(Encoder-Decoder) モデル encoder で発話を取得し,decoder で次の発話を生成 • HRED(階層的 Encoder-Decoder)
モデル 発話間の依存関係を取得するために,ED モデルを拡張した もの • ED-DA モデル 対話行為情報を使用する ED モデルの拡張 • HRED-DA モデル 対話行為情報を使用する HRED モデルの拡張 6
識別モデル • Siamese モデル 文脈 encoder と発話 encoder の出力間の距離を誤差として 学習する識別モデル
• HSiamese モデル (階層的 Siamese モデル) Siamese モデルの 2 つの encoder を階層構造にしたもの • Simese-DA モデル DA-encoder から対話行為情報を取得した Siamese モデル の拡張 • HSiamese-DA モデル 提案手法.詳細は後述 7
提案手法 • 3 つの encoder を持つ • 階層 encoder -
発話間の依存関係を捉える • 発話 encoder - 候補応答表現,発話表現を取得する • DA-encoder - 発話と対話行為間の依存関係を捉える • 階層 encoder と DA-encoder の出力を線形結合し,文脈の 構成表現を取得 • 文脈の構成表現と発話 encoder の出力から,候補応答を出 力に関連付ける • 正と負の例を含むすべてのラベル付き会話のクロスエント ロピーを最小化することで、モデルをトレーニング • 候補応答から正例をより高いランクに割り当てられるかを 8
DailyDialog dataset ⅰ • 対話行為で注釈を付けられた唯一のデータセット • 対話行為は 4 つに分類される •
Inform - 何かしらの情報提供 • Question - 質問 • Directives - 要求,指導,提案など • Commissive - 受け入れ,拒否の要求 • 本論文では,2 通りの変更を加えて使用 • 生成モデル - 文脈を構成する 3 つの発話と応答の発話,計 4 発話ず つでトレーニング.データ総数は,train:30515,test:2849,valid:2695 • 識別モデル - 応答発話をランダムな発話に置換し,負例を学習. データ総数は,train:61030,test:2849,valid:2695 9
DailyDialog dataset ⅱ Table 1: A snippet of a conversation
showing few dialogues between a Human (H) and Bot (B).[1] 10
Results i Table 2: Comparison of different models with and
without dialogue acts.[1] 11
Results ii Table 3: Number of rank-1 conversations and theie
DAs for Kth and (K + 1)th utterances.[1] 12
Results ⅲ • テストデータとモデル出力の両方で,特定のパターンが優 位になっている • Directives は Question と混同しやすく曖昧さを持つ
• 精度が向上していることから,対話行為情報により統一性 をもたらしたと考えられる • これにより,対話行為情報は,学習を補助していると考え られる 13
Conclusion • モデルに関係なく,対話行為の情報がパフォーマンスの 改善に有効であることを示した • 対話行為情報の階層構造を活用した新しいモデルを提案し, MRR が 84.8%に改善した •
対話行為情報を含めることで,統一性がもたらされ, 曖昧さが排除されることを確認した 14