Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Dialogue-act-driven Conversation Model: An Expe...
Search
shu_suzuki
February 25, 2019
Technology
0
85
Dialogue-act-driven Conversation Model: An Experimental Study
長岡技術科学
自然言語処理研究室
鈴木脩右
文献紹介
shu_suzuki
February 25, 2019
Tweet
Share
More Decks by shu_suzuki
See All by shu_suzuki
文献紹介:Investigating Evaluation of Open-Domain Dialogue Systems With Human Generated Multiple References
shu_suzuki
0
190
文献紹介:Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study
shu_suzuki
0
83
文献紹介: How to Make Context More Useful? An Empirical Study on Context-Aware Neural Conversational Models
shu_suzuki
0
340
文献紹介:Conversational Response Re-ranking Based on Event Causality and Role Factored Tensor Event Embedding
shu_suzuki
0
160
文献紹介:Modeling Semantic Relationship in Multi-turn Conversations with Hierarchical Latent Variables
shu_suzuki
0
76
文献紹介:ReCoSa: Detecting the Relevant Contexts with Self-Attention for Multi-turn Dialogue Generation
shu_suzuki
0
210
文献紹介:Better Automatic Evaluation of Open-Domain Dialogue Systems with Contextualized Embeddings
shu_suzuki
0
120
文献紹介:Why are Sequence-to-Sequence Models So Dull?
shu_suzuki
0
69
文献紹介:Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network
shu_suzuki
0
210
Other Decks in Technology
See All in Technology
年間40件以上の登壇を続けて見えた「本当の発信力」/ 20251213 Masaki Okuda
shift_evolve
PRO
1
140
アプリにAIを正しく組み込むための アーキテクチャ── 国産LLMの現実と実践
kohju
0
140
業務のトイルをバスターせよ 〜AI時代の生存戦略〜
staka121
PRO
2
230
普段使ってるClaude Skillsの紹介(by Notebooklm)
zerebom
1
390
ペアーズにおけるAIエージェント 基盤とText to SQLツールの紹介
hisamouna
2
920
文字列の並び順 / Unicode Collation
tmtms
3
620
CARTAのAI CoE が挑む「事業を進化させる AI エンジニアリング」 / carta ai coe evolution business ai engineering
carta_engineering
0
2.1k
AWSに革命を起こすかもしれない新サービス・アップデートについてのお話
yama3133
0
300
WordPress は終わったのか ~今のWordPress の制作手法ってなにがあんねん?~ / Is WordPress Over? How We Build with WordPress Today
tbshiki
2
860
Database イノベーショントークを振り返る/reinvent-2025-database-innovation-talk-recap
emiki
0
240
生成AI活用の型ハンズオン〜顧客課題起点で設計する7つのステップ
yushin_n
0
260
re:Invent 2025 ~何をする者であり、どこへいくのか~
tetutetu214
0
240
Featured
See All Featured
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
0
170
A designer walks into a library…
pauljervisheath
210
24k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
0
39
The SEO identity crisis: Don't let AI make you average
varn
0
32
Making the Leap to Tech Lead
cromwellryan
135
9.7k
What the history of the web can teach us about the future of AI
inesmontani
PRO
0
370
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
400
The SEO Collaboration Effect
kristinabergwall1
0
300
A Modern Web Designer's Workflow
chriscoyier
698
190k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
130
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
2
250
Transcript
文献紹介 Dialogue-act-driven Conversation Model: An Experimental Study 鈴木脩右 2019/2/25 長岡技術科学大学
自然言語処理研究室 1
Reference [1] Harshit Kumar, Arvind Agarwal, and Sachindra Joshi. Dialogue-act-driven
Conversation Model : An Experimental Study. In Proceedings of the 27th International Conference on Computational Linguistics, pages 1246–1256, Santa Fe, New Mexico, USA, August 2018. Association for Computational Linguistics. 2
Abstract • 発話選択において,対話行為情報を追加することの有用性 に関する研究 • seq2seq encoder-decoder モデル,階層的 encoder-decoder モデルなどモデルに関係なく性能が向上
• 階層的 encoder を利用した新しいモデルを構築 • DailyDialog dataset において,MRR で約 84.4%を達成し, baseline より優れた性能を持つ 3
Introduction i • 応答予測は2つの方法で定式化可能 • 純粋な発話の生成 • 発話候補からの選択 (本論文ではこちらを使用) •
発話選択タスクのモデルは 2 種類 • 生成モデル (seq2seq モデル) - 与えられた文脈で応答を生成 • 識別モデル (Siamese モデル) - 文脈から適切,不適切な応答を識別 • 対話行為とは,話し手の意図を表わす抽象的概念のこと 4
Introduction ii • 本研究での貢献は以下の 4 つ • 発話選択タスクにおいて,対話行為情報がモデルに関係なく有効 であることの検証 •
Siamese network,対話固有の階層構造,それぞれの長所を組み 合わせた新モデルを提案 • 対話行為情報の有用性について,以下の観点から考察 • モデルは有効な対話行為を学習するか • 対話行為は統一性をもたらすか • 対話行為はモデルが正しいパターンの学習を補助するか • DailyDialog dataset を,発話選択タスクに合わせて修正 5
生成モデル • ED(Encoder-Decoder) モデル encoder で発話を取得し,decoder で次の発話を生成 • HRED(階層的 Encoder-Decoder)
モデル 発話間の依存関係を取得するために,ED モデルを拡張した もの • ED-DA モデル 対話行為情報を使用する ED モデルの拡張 • HRED-DA モデル 対話行為情報を使用する HRED モデルの拡張 6
識別モデル • Siamese モデル 文脈 encoder と発話 encoder の出力間の距離を誤差として 学習する識別モデル
• HSiamese モデル (階層的 Siamese モデル) Siamese モデルの 2 つの encoder を階層構造にしたもの • Simese-DA モデル DA-encoder から対話行為情報を取得した Siamese モデル の拡張 • HSiamese-DA モデル 提案手法.詳細は後述 7
提案手法 • 3 つの encoder を持つ • 階層 encoder -
発話間の依存関係を捉える • 発話 encoder - 候補応答表現,発話表現を取得する • DA-encoder - 発話と対話行為間の依存関係を捉える • 階層 encoder と DA-encoder の出力を線形結合し,文脈の 構成表現を取得 • 文脈の構成表現と発話 encoder の出力から,候補応答を出 力に関連付ける • 正と負の例を含むすべてのラベル付き会話のクロスエント ロピーを最小化することで、モデルをトレーニング • 候補応答から正例をより高いランクに割り当てられるかを 8
DailyDialog dataset ⅰ • 対話行為で注釈を付けられた唯一のデータセット • 対話行為は 4 つに分類される •
Inform - 何かしらの情報提供 • Question - 質問 • Directives - 要求,指導,提案など • Commissive - 受け入れ,拒否の要求 • 本論文では,2 通りの変更を加えて使用 • 生成モデル - 文脈を構成する 3 つの発話と応答の発話,計 4 発話ず つでトレーニング.データ総数は,train:30515,test:2849,valid:2695 • 識別モデル - 応答発話をランダムな発話に置換し,負例を学習. データ総数は,train:61030,test:2849,valid:2695 9
DailyDialog dataset ⅱ Table 1: A snippet of a conversation
showing few dialogues between a Human (H) and Bot (B).[1] 10
Results i Table 2: Comparison of different models with and
without dialogue acts.[1] 11
Results ii Table 3: Number of rank-1 conversations and theie
DAs for Kth and (K + 1)th utterances.[1] 12
Results ⅲ • テストデータとモデル出力の両方で,特定のパターンが優 位になっている • Directives は Question と混同しやすく曖昧さを持つ
• 精度が向上していることから,対話行為情報により統一性 をもたらしたと考えられる • これにより,対話行為情報は,学習を補助していると考え られる 13
Conclusion • モデルに関係なく,対話行為の情報がパフォーマンスの 改善に有効であることを示した • 対話行為情報の階層構造を活用した新しいモデルを提案し, MRR が 84.8%に改善した •
対話行為情報を含めることで,統一性がもたらされ, 曖昧さが排除されることを確認した 14