Slide 45
Slide 45 text
© GO Inc. 45
● 学習を前後半でseedingとevolutionに分け、seedingでは全てのサンプルを使って学習し、
evolutionではseedingでモデルに記憶されたサンプルだけを使って学習する
● 各サンプルが学習時にモデルに提示された際の分類結果の履歴を保存しておき、履歴の中
で最大頻度となるクラスが真値に一致する場合、そのサンプルは記憶されたと判断する
● seedingからevolutionへの切り替え点は記憶されたサンプルの割合とデータセットにおけ
るノイズの割合から自動的に決定する
MORPH [Song+, KDD 2021]
学習
全サンプル
記憶された
サンプル
記憶されなかった
サンプル
Seeding Evolution
学習
…
3, 3, 3, 3, 1, 1, …
1 2 3 4 5
頻度
クラス
学習段階での
分類結果(新→旧)
記憶
2, 2, 2, 3, 1, 1, …
1 2 3 4 5
頻度
クラス
学習段階での
分類結果(新→旧)
記憶
真値3 真値3
H. Song et al., “Robust learning by self-transition for handling noisy labels,” KDD, 2021.
サイズ
拡大
ノイズ
除去
冗長性
削減