Slide 5
Slide 5 text
①どんなもの?
テキストの話者らしさを評価する手法の提案。
話者に対する知識がなくとも同一話者判定ができる手法
。
②先行研究と比べてどこがすごい
?
● 評価者が任意の話者を知らなくても評価可能な指標である点
● 人によって評価精度のブレが小さい点
③技術や手法のキモはどこ
?
対話比較(話者SA.Target,SA.Partnerによる対話DAと話者
SB.Target,SB.Partner による対話DBが存在するときに,2つの対話 DA,DB
を比較して,話者SA.TargetとSB.Targetが同一話者かを判定する
*1)により
アノテータが同一話者を判定する。
その際、話者判定のためのデータを以下の3種類に分割した。
● Same: 対象話者のみ同一の話者
○ SA,Target=SB,Target かつ SA,Partner≠SB,Partner
● Diff: 対象話者・対話相手が全て異なる話者
○ SA,Target≠SB,Target≠SA,Partner≠SB,Partner
● Odd: 対象話者は異なる話者だが,対話相手が同一の話者
○ SA,Target≠SB,Target かつ SA,Partner=SB,Partner
[1E5-GS-6-06] 対話比較による話者同一性判定タスクの提案とベースラインモデルの検討
④どうやって有効だと検証した
?
80名総当たり(3000対話ほど)のテキストチャット[Sugiyama 21]でAccuracyを
比較。
● 人手評価:エキスパート80%、クラウドワーカー73%(一致率
0.7)
● 自動評価(BERT):75%
⑤議論はある?
● Sameの精度が低い*2?と思った
○ 話を合わせるため同じ人が違う趣味を答えるケースあり
● BERTのSame,Diff,Oddは?と思った
● 似せるために自動生成した文章との比較は?と思った
*1 *2