③技術や手法のキモはどこ ? 対話比較(話者SA.Target,SA.Partnerによる対話DAと話者 SB.Target,SB.Partner による対話DBが存在するときに,2つの対話 DA,DB を比較して,話者SA.TargetとSB.Targetが同一話者かを判定する *1)により アノテータが同一話者を判定する。 その際、話者判定のためのデータを以下の3種類に分割した。 • Same: 対象話者のみ同一の話者 ◦ SA,Target=SB,Target かつ SA,Partner≠SB,Partner • Diff: 対象話者・対話相手が全て異なる話者 ◦ SA,Target≠SB,Target≠SA,Partner≠SB,Partner • Odd: 対象話者は異なる話者だが,対話相手が同一の話者 ◦ SA,Target≠SB,Target かつ SA,Partner=SB,Partner [1E5-GS-6-06] 対話比較による話者同一性判定タスクの提案とベースラインモデルの検討 ④どうやって有効だと検証した ? 80名総当たり(3000対話ほど)のテキストチャット[Sugiyama 21]でAccuracyを 比較。 • 人手評価:エキスパート80%、クラウドワーカー73%(一致率 0.7) • 自動評価(BERT):75% ⑤議論はある? • Sameの精度が低い*2?と思った ◦ 話を合わせるため同じ人が違う趣味を答えるケースあり • BERTのSame,Diff,Oddは?と思った • 似せるために自動生成した文章との比較は?と思った *1 *2