Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:Quasi-Recurrent Neural Networks に基づく対話モデルを...
Search
shu_suzuki
March 21, 2019
Technology
0
120
文献紹介:Quasi-Recurrent Neural Networks に基づく対話モデルを用いた対話破綻検出
長岡技術科学
自然言語処理研究室
鈴木脩右
shu_suzuki
March 21, 2019
Tweet
Share
More Decks by shu_suzuki
See All by shu_suzuki
文献紹介:Investigating Evaluation of Open-Domain Dialogue Systems With Human Generated Multiple References
shu_suzuki
0
190
文献紹介:Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study
shu_suzuki
0
82
文献紹介: How to Make Context More Useful? An Empirical Study on Context-Aware Neural Conversational Models
shu_suzuki
0
320
文献紹介:Conversational Response Re-ranking Based on Event Causality and Role Factored Tensor Event Embedding
shu_suzuki
0
160
文献紹介:Modeling Semantic Relationship in Multi-turn Conversations with Hierarchical Latent Variables
shu_suzuki
0
76
文献紹介:ReCoSa: Detecting the Relevant Contexts with Self-Attention for Multi-turn Dialogue Generation
shu_suzuki
0
210
文献紹介:Better Automatic Evaluation of Open-Domain Dialogue Systems with Contextualized Embeddings
shu_suzuki
0
110
文献紹介:Why are Sequence-to-Sequence Models So Dull?
shu_suzuki
0
66
文献紹介:Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network
shu_suzuki
0
210
Other Decks in Technology
See All in Technology
IoT x エッジAI - リアルタイ ムAI活用のPoCを今すぐ始め る方法 -
niizawat
0
120
[ JAWS-UG 東京 CommunityBuilders Night #2 ]SlackとAmazon Q Developerで 運用効率化を模索する
sh_fk2
3
460
新規プロダクトでプロトタイプから正式リリースまでNext.jsで開発したリアル
kawanoriku0
1
220
サラリーマンの小遣いで作るtoCサービス - Cloudflare Workersでスケールする開発戦略
shinaps
2
470
メルカリIBISの紹介
0gm
0
420
要件定義・デザインフェーズでもAIを活用して、コミュニケーションの密度を高める
kazukihayase
0
120
プラットフォーム転換期におけるGitHub Copilot活用〜Coding agentがそれを加速するか〜 / Leveraging GitHub Copilot During Platform Transition Periods
aeonpeople
1
240
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
480
職種の壁を溶かして開発サイクルを高速に回す~情報透明性と職種越境から考えるAIフレンドリーな職種間連携~
daitasu
0
190
TS-S205_昨年対比2倍以上の機能追加を実現するデータ基盤プロジェクトでのAI活用について
kaz3284
1
230
今日から始めるAWSセキュリティ対策 3ステップでわかる実践ガイド
yoshidatakeshi1994
0
120
2025/09/16 仕様駆動開発とAI-DLCが導くAI駆動開発の新フェーズ
masahiro_okamura
0
140
Featured
See All Featured
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Embracing the Ebb and Flow
colly
87
4.8k
Site-Speed That Sticks
csswizardry
10
820
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
Making Projects Easy
brettharned
117
6.4k
Bash Introduction
62gerente
615
210k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.9k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Transcript
文献紹介 Quasi-Recurrent Neural Networks に基づく対話モデ ルを用いた対話破綻検出 鈴木脩右 2019/3/21 長岡技術科学大学 自然言語処理研究室
1
Reference [1] 田中 涼太 and 李 晃伸. Quasi-Recurrent Neural Networks
に基づく対話モデルを用 いた対話破綻検出. In 人工知能学会全国大会論文集第 32 回全国大会 (2018), pages 4G101–4G101. 一般社団法人人工知能学会, 2018. 2
はじめに • 雑談対話システムにおいて,対話破綻が発生することが問 題となっている • 対話破綻の検出手法として,Neural Conversational Model (NCM) を用いるものがある
→ RNN を用いるため学習に時間がかかる • 本研究では Quansi-RNN(QRNN) を NCM に用いることで学 習の高速化,性能向上を図った 3
対話モデルを用いた対話破綻検出 • 対話破綻検出のメリット • システムが発話前後で対話破綻を認識可能となる • 対話破綻の事前回避,リカバリが期待できる • 対話破綻検出の課題 •
対話中に破綻検出を行う必要がある • 対話モデルと破綻検出を統合した枠組みで考える • NCM(seq2seq モデル) • Encoder で発話の単語列を読み込む • Decoder で応答文を出力 4
先行研究 • NCM を拡張し,Encoder と Decoder の最終時刻の隠れ層を 素性に分類器を作成 (小林ら) •
対話データのアノテーションを分布に基づいて学習データ を拡張 (久保ら) 5
提案モデル概要 1. O, △,X のアノテーション分布に基づいて応答文の末尾に対 話破綻ラベルを付与 2. 上記データを元に対話モデルを QRNN で学習
3. 発話文,応答文埋め込みベクトル vi ,vo を獲得 4. vi ,vo を素性に SVM で識別 6
提案モデル図 Figure 1: 提案モデル [1] 7
QRNN • 畳み込み層と再帰構造を持つプーリング層の 2 層により構 成されるニューラルネット • 畳み込みには未来の時刻情報を含まないように k −
1 のパ ディングを入れる Masked Convolution を用いる • プーリング層では過去の履歴を考慮しつつ畳み込みで得ら れた局所特徴量の集約を行う → 文脈を考慮した解釈が可能 8
発話文と応答文の特徴量抽出 • 対話モデルの Encoder と Decoder の最終時刻における隠れ 層を特徴量として抽出 • 最終時刻における隠れ層は発話の大局情報
(単語やフレーズ などの局所情報を時間軸に沿いまとめたもの) • 大局的に対話破綻を検出できる 9
データセット(1) • 対話破綻検出チャレンジ 1,2 を使用 • 対話データには以下のラベルでアノテートされている • O 破綻ではない:問題なく対話が継続できる
• △ 違和感がある:スムーズな対話継続が困難 • X 破綻している:対話の継続が困難 10
データセット(2) Table 1: 配布データセット [1] 11
実験結果 Figure 2: 学習速度 [1] Table 2: 破綻検出の結果 [1] 12
おわりに • QRNN を用いて,高速かつ高精度な対話破綻検出器を構築 • 学習速度が約 3.2 倍の高速化を実現 • 文脈に沿った大局的な学習が可能になり,検出精度が改善
• 対話破綻検出器の素性の最適化,対話モデルに用いる学習 データに大規模なデータセットを用いることが課題 13