Slide 44
Slide 44 text
44 National Institute of Informatics
モデルマージは盆地の性質を利用して良いモデルを得る
◼
盆地の性質を利用したのがモデルマージ
◼
モデルスープというマージ手法は、共通の事前学習モデルから
ファインチューニングを複数行い θ
1
, θ
2
, …, θ
n
を得て、平均
を用いる
このモデルは θ
1
, θ
2
, …, θ
n
よりも性能が高く頑健である
なぜ?
Mitchell Wortsman, Gabriel Ilharco, Samir Yitzhak Gadre, Rebecca Roelofs, Raphael Gontijo Lopes, Ari S. Morcos, Hongseok Namkoong,
Ali Farhadi, Yair Carmon, Simon Kornblith, and Ludwig Schmidt. Model soups: averaging weights of multiple fine-tuned models improves
accuracy without increasing inference time. ICML 2022.