Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Dialogue-act-driven Conversation Model: An Expe...
Search
shu_suzuki
February 25, 2019
Technology
0
82
Dialogue-act-driven Conversation Model: An Experimental Study
長岡技術科学
自然言語処理研究室
鈴木脩右
文献紹介
shu_suzuki
February 25, 2019
Tweet
Share
More Decks by shu_suzuki
See All by shu_suzuki
文献紹介:Investigating Evaluation of Open-Domain Dialogue Systems With Human Generated Multiple References
shu_suzuki
0
170
文献紹介:Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study
shu_suzuki
0
77
文献紹介: How to Make Context More Useful? An Empirical Study on Context-Aware Neural Conversational Models
shu_suzuki
0
310
文献紹介:Conversational Response Re-ranking Based on Event Causality and Role Factored Tensor Event Embedding
shu_suzuki
0
160
文献紹介:Modeling Semantic Relationship in Multi-turn Conversations with Hierarchical Latent Variables
shu_suzuki
0
70
文献紹介:ReCoSa: Detecting the Relevant Contexts with Self-Attention for Multi-turn Dialogue Generation
shu_suzuki
0
200
文献紹介:Better Automatic Evaluation of Open-Domain Dialogue Systems with Contextualized Embeddings
shu_suzuki
0
110
文献紹介:Why are Sequence-to-Sequence Models So Dull?
shu_suzuki
0
62
文献紹介:Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network
shu_suzuki
0
210
Other Decks in Technology
See All in Technology
Copilot Agentを普段使いしてわかった、バックエンド開発で使えるTips
ykagano
1
1.4k
doda開発 生成AI元年宣言!自家製AIエージェントから始める生産性改革 / doda Development Declaration of the First Year of Generated AI! Productivity Reforms Starting with Home-grown AI Agents
techtekt
0
180
新卒3年目の後悔〜機械学習モデルジョブの運用を頑張った話〜
kameitomohiro
0
360
CIでのgolangci-lintの実行を約90%削減した話
kazukihayase
0
330
活きてなかったデータを活かしてみた話 / Shirokane Kougyou vol 19
sansan_randd
1
390
從四件事帶你見識見識 事件驅動架構設計 (EDA)
line_developers_tw
PRO
0
910
SFTPコンテナからファイルをダウンロードする
dip
0
540
BrainPadプログラミングコンテスト記念LT会2025_社内イベント&問題解説
brainpadpr
0
110
CSS、JSをHTMLテンプレートにまとめるフロントエンド戦略
d120145
0
180
Microsoft Build 2025 技術/製品動向 for Microsoft Startup Tech Community
torumakabe
1
180
讓測試不再 BB! 從 BDD 到 CI/CD, 不靠人力也能 MVP
line_developers_tw
PRO
0
1k
Кто отправит outbox? Валентин Удальцов, автор канала Пых
lamodatech
0
230
Featured
See All Featured
Scaling GitHub
holman
459
140k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
The Cost Of JavaScript in 2023
addyosmani
50
8.4k
Fireside Chat
paigeccino
37
3.5k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.5k
Unsuck your backbone
ammeep
671
58k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
4
190
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
60k
Product Roadmaps are Hard
iamctodd
PRO
53
11k
StorybookのUI Testing Handbookを読んだ
zakiyama
30
5.8k
Code Review Best Practice
trishagee
68
18k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
910
Transcript
文献紹介 Dialogue-act-driven Conversation Model: An Experimental Study 鈴木脩右 2019/2/25 長岡技術科学大学
自然言語処理研究室 1
Reference [1] Harshit Kumar, Arvind Agarwal, and Sachindra Joshi. Dialogue-act-driven
Conversation Model : An Experimental Study. In Proceedings of the 27th International Conference on Computational Linguistics, pages 1246–1256, Santa Fe, New Mexico, USA, August 2018. Association for Computational Linguistics. 2
Abstract • 発話選択において,対話行為情報を追加することの有用性 に関する研究 • seq2seq encoder-decoder モデル,階層的 encoder-decoder モデルなどモデルに関係なく性能が向上
• 階層的 encoder を利用した新しいモデルを構築 • DailyDialog dataset において,MRR で約 84.4%を達成し, baseline より優れた性能を持つ 3
Introduction i • 応答予測は2つの方法で定式化可能 • 純粋な発話の生成 • 発話候補からの選択 (本論文ではこちらを使用) •
発話選択タスクのモデルは 2 種類 • 生成モデル (seq2seq モデル) - 与えられた文脈で応答を生成 • 識別モデル (Siamese モデル) - 文脈から適切,不適切な応答を識別 • 対話行為とは,話し手の意図を表わす抽象的概念のこと 4
Introduction ii • 本研究での貢献は以下の 4 つ • 発話選択タスクにおいて,対話行為情報がモデルに関係なく有効 であることの検証 •
Siamese network,対話固有の階層構造,それぞれの長所を組み 合わせた新モデルを提案 • 対話行為情報の有用性について,以下の観点から考察 • モデルは有効な対話行為を学習するか • 対話行為は統一性をもたらすか • 対話行為はモデルが正しいパターンの学習を補助するか • DailyDialog dataset を,発話選択タスクに合わせて修正 5
生成モデル • ED(Encoder-Decoder) モデル encoder で発話を取得し,decoder で次の発話を生成 • HRED(階層的 Encoder-Decoder)
モデル 発話間の依存関係を取得するために,ED モデルを拡張した もの • ED-DA モデル 対話行為情報を使用する ED モデルの拡張 • HRED-DA モデル 対話行為情報を使用する HRED モデルの拡張 6
識別モデル • Siamese モデル 文脈 encoder と発話 encoder の出力間の距離を誤差として 学習する識別モデル
• HSiamese モデル (階層的 Siamese モデル) Siamese モデルの 2 つの encoder を階層構造にしたもの • Simese-DA モデル DA-encoder から対話行為情報を取得した Siamese モデル の拡張 • HSiamese-DA モデル 提案手法.詳細は後述 7
提案手法 • 3 つの encoder を持つ • 階層 encoder -
発話間の依存関係を捉える • 発話 encoder - 候補応答表現,発話表現を取得する • DA-encoder - 発話と対話行為間の依存関係を捉える • 階層 encoder と DA-encoder の出力を線形結合し,文脈の 構成表現を取得 • 文脈の構成表現と発話 encoder の出力から,候補応答を出 力に関連付ける • 正と負の例を含むすべてのラベル付き会話のクロスエント ロピーを最小化することで、モデルをトレーニング • 候補応答から正例をより高いランクに割り当てられるかを 8
DailyDialog dataset ⅰ • 対話行為で注釈を付けられた唯一のデータセット • 対話行為は 4 つに分類される •
Inform - 何かしらの情報提供 • Question - 質問 • Directives - 要求,指導,提案など • Commissive - 受け入れ,拒否の要求 • 本論文では,2 通りの変更を加えて使用 • 生成モデル - 文脈を構成する 3 つの発話と応答の発話,計 4 発話ず つでトレーニング.データ総数は,train:30515,test:2849,valid:2695 • 識別モデル - 応答発話をランダムな発話に置換し,負例を学習. データ総数は,train:61030,test:2849,valid:2695 9
DailyDialog dataset ⅱ Table 1: A snippet of a conversation
showing few dialogues between a Human (H) and Bot (B).[1] 10
Results i Table 2: Comparison of different models with and
without dialogue acts.[1] 11
Results ii Table 3: Number of rank-1 conversations and theie
DAs for Kth and (K + 1)th utterances.[1] 12
Results ⅲ • テストデータとモデル出力の両方で,特定のパターンが優 位になっている • Directives は Question と混同しやすく曖昧さを持つ
• 精度が向上していることから,対話行為情報により統一性 をもたらしたと考えられる • これにより,対話行為情報は,学習を補助していると考え られる 13
Conclusion • モデルに関係なく,対話行為の情報がパフォーマンスの 改善に有効であることを示した • 対話行為情報の階層構造を活用した新しいモデルを提案し, MRR が 84.8%に改善した •
対話行為情報を含めることで,統一性がもたらされ, 曖昧さが排除されることを確認した 14