Slide 4
Slide 4 text
前提知識
4
Model Merging
複数の事前学習済みモデルを組み合わせることで,単一のタスクに特化したモデルの
性能を超える汎用的なモデルを生成する手法
主な手法
Task Vector algorithms...
タスクベクトルを使い新しいモデルを作成する手法
Task Arithmetic
TIES
DARE
SLERP
二つモデルのパラメータを使い球面線形補間する手法
Frankenmerging
複数のモデルから異なるレイヤーを積み重ねて新しいモデルを作成する手法
MoE
モデルマージの手法としてのMoE
「Model Merging: MoE, Frankenmerging, SLERP, and Task Vector Algorithms
」の記事の内容をもとにまとめています
https://deci.ai/blog/model-merging-moe-frankenmerging-slerp-and-task-vector-algorithms/