Slide 17
Slide 17 text
17
実験データセット
⽇本語の⽂章分類データセットを使⽤
BERT精度はファインチューニング済み
データセット名 分類タスク クラス 訓練 テスト BERT 精度
MARC-ja Amazon 商品レビュー 2 10,000 5,654 94.32
WRIME twitterの感情分析 3 30,000 2,500 71.32
Livedoor-news ニュース記事トピック
分類
9 4,421 1,474 96.46
※ MARC-jaは訓練データのネガポジ⽐率を1:1に変更
※ WRIMEは5クラスをタスク簡単化のため3クラスに変更
強いネガティブと弱いネガティブ->ネガティブ
強いポジティブと弱いポジティブ->ポジティブ