Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介_201911_EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks

T.Tada
November 28, 2019

文献紹介_201911_EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks

T.Tada

November 28, 2019
Tweet

More Decks by T.Tada

Other Decks in Technology

Transcript

  1. - 文献紹介 2019 Nov. 28 - EDA: Easy Data Augmentation

    Techniques for Boosting Performance on Text Classification Tasks 長岡技術科学大学
 自然言語処理研究室
 多田太郎

  2. EDA 5 トレーニングデータの特定の文に以下4つのいずれかの操作をランダムに実施 ・Synonym Replacement (SR):  文からn単語(ストップワードでない)をランダムで選択  各単語をランダムに選ばれた同義語と置き換え ・Random Insertion

    (RI):  文中のランダムな単語(ストップワードでない)のランダムな同義語を取得  文のランダムな位置に挿入  この作業をn回行なう これは先行研究でやってる