Slide 24
Slide 24 text
実験設定:2種類のデータセットで評価
- 24 -
■ データセット
• [Wada+, CoNLL23]で収集された2つのデータセットを使⽤
⽇本語の⾃動評価タスクで最⼤規模
サンプル数:103,170
Shichimi データセット
ロボットに対する指⽰⽂を含む
サンプル数:1,920
PFN-PIC-gen
学習,検証およびテストに使⽤ テストのみに使⽤・zero-shot性能を評価
10個の標準的なモデルで⽣成⽂を作成
SAT [Xu+, ICML15]
ORT [Herdade+, NeurIPS19]
ℳ!-Transformer [Cornia+, CVPR20]
DLCT [Luo+, AAAI21]
ER-SAN [Li+, IJCAI22]
ClipCapmlp
[Mokady+, 21]
ClipCaptrm
[Mokady+, 21]
Transformer𝐿 ∈ 3, 6, 12