NLP2016 発表スライド

“個性に着目した対話システム”の自然性の評価実験須戸悠太†，高椋琴美† †，谷田泰郎† †，山本和英† ††シナジーマーケティング株式会社
†長岡技術科学大学 1

背景（1/2） • シナジーマーケティング社では、Societas※という価値観モデルによって個人の個性を規定し，個性の違いによる人の行動・興味・人間関係の持ち方などのモデル化を目指している． • 特定の人の発話を学習して発話を生成する“個性” を持たせたロボットと人が雑談することによって得ら
れる対話データを収集したい． 2 ※アンケートや行動などから性格診断ができるようなもの

背景（2/2） • 先行研究で対話システムの「個性性」と「自然性」についての評価を行ってきたが，自然性が担保されていないと個性性の評価が難しい． • 対話の自然性を上げるには学習データの数を増やすことが一番取り組みやすい． –
個性性を確保しながらデータ数を増やす必要がある． • 本研究では，どれくらいのデータ数があれば自然性を担保できるのかの評価実験を行った． 3

対話システムについて • 学習データは｛“相手の発話”，“（相手に対する）ロボットの発話”｝の２文で構成されている． – 入力された文に対して，類似度の高い“相手の発話”を選択し，それに対応する“ロボットの発話”を出力として返す． 4 相手の発話（相手に対する）ロボットの発話
Data_1 「食べ物だったら何が好き？」「ラーメン」 Data_2 「体動かすのは気持ちいいよ」「散歩しかしてないや」 ⋮ ⋮ ⋮ Data_n 「～～」「～～」

評価実験の流れ 5 No.1 評価者 No.2 No.3 No.4 3体のロボットと会話アンケートに記入
休憩前半 3体のロボットと会話アンケートに記入後半最終アンケートグループインタビューチャット形式で会話人興味ある？あるけどあんまり好きじゃないロボ人なんだそれそうそう、だから「リボンの騎士」は宝塚風ロボ人リボンの騎士も手塚治虫だねうん、手塚治虫は偉いなロボ人手塚治虫リスペクトしまくりだね福山ファンに怒られるぞロボ

学習データの数の設定 • 学習データのデータ数を3段階に設定した． – A : 14,000対 – B
: Aからランダムに10,000対 – C : Bからランダムに5,000対 6 1A:14,000対 1B:10,000対 1C:5,000対 2A:14,000対 2B:10,000対 2C:5,000対 A B C 作成者1 作成者2 6種類のロボット

自然性評価の質問項目 • 各質問項目にそれぞれ10 点満点で評価してもらう． • 評価基準等はこちらからは指定せず，被験者に判断を任せた． 7 1.
会話がつながる 2. あなたの発言の意味を理解している 3. 受け答えが自然である 4. 突拍子もない発言が少ない 5. 会話が一方的にならない 6.表現が多様である 7.言い回しに違和感がない 8.話題が豊富である 9. 会話が楽しかった 10. また話したいと思う

アンケート結果の標準化 • 以下の理由から各被験者，前半後半で分けて標準化を行った． – 各被験者の評価に対する考え方の違い – 前半・後半での実験への慣れなどの環境の変化 – 前半・後半で会話の形式を変えたことで評価が変わった
人もいた • 以下の式で標準化を行い，その合計スコアを求めた． 1. = 1 − 2 =1 2. = − 8 ：標準偏差：評価点：平均値：データ数：標準化された値

結果 9 -8 -6 -4 -2 0 2 4 6
8 10 12 合計スコア学習データ数 type-1 type-2 5,000 10,000 14,000 考察（2/2）考察（1/2）

考察（1/2） • 学習データ数5,000から10,000ではマイナス評価の数が減っている． • 一方で、10,000から14,000ではほとんど差はない． • 作成コスト等を考慮すると，今回使用した対話システムでは学習データの数は10,000あれば十分では
ないか． 10

考察（2/2） • データ数10,000で極端に高評価な箇所について． – データ数10,000のロボットと話した時に出てきた話題が面白かった． – 会話が成り立ちにくかったロボットとの会話の後に、相性のいいロボットと話し高評価であった．
• 会話によって引き出される話題やロボットとの相性も評価に影響されていると考えられる． 11

おわりに • 個性性評価のためには自然性をある程度担保する必要がある． • 自然性担保に必要なデータ数の評価実験を行った． • 今回使用した対話システムでは，学習データの数は 10,000あれば十分ではという結論が得られた． 12
対話システムを体験することができますので， Synergy Marketingのスポンサーブースにもぜひ足を運んでみてください！

（補足1）学習データの作成 ① “ロボットの発話”にあたる，1,500種類の発話文を作成する． ② クラウドソーシングを利用して“ロボットの発話”に対応する“相手の発話”を収集した． – 「？」の部分を想像して入れてもらう
13 相手の発話（相手に対する）ロボットの発話 Data_1 「？」「サッカー」 Data_2 「？」「最近面白いと思う番組少ない」 ⋮ ⋮ ⋮ Data_n 「？」「～～」

NLP2016 発表スライド

NLP2016 発表スライド

Yuta

More Decks by Yuta

Other Decks in Education

Featured

Transcript

“個性に着目した対話システム”の自然性の評価実験須戸悠太†，高椋琴美† †，谷田泰郎† †，山本和英† ††シナジーマーケティング株式会社

評価実験の流れ 5 No.1 評価者 No.2 No.3 No.4 3体のロボットと会話アンケートに記入

学習データの数の設定 • 学習データのデータ数を3段階に設定した． – A : 14,000対 – B

自然性評価の質問項目 • 各質問項目にそれぞれ10 点満点で評価してもらう． • 評価基準等はこちらからは指定せず，被験者に判断を任せた． 7 1.

結果 9 -8 -6 -4 -2 0 2 4 6