rights reserved. 18 1. 学習の流れは次の通り ① タスクが⼀つ追加されるたびに、⼀つの特徴抽出機を作成する。 – 過去の学習済パラメータは凍結し、学習中も変化がない。 ② 特徴抽出機の出⼒を結合し、分類する。 – Training LossはClassification Loss, Auxiliary Loss, Sparsity Lossの3つに区分され る。(詳細は次のP) 2. Pruning ① Channel-levelでの学習可能なマスクを⽤いてパラメータ数を削減する。