論文紹介 Editing Models with Task Arithmetic

AI 2023.04.21 Yuki Abe 株式会社ディー・エヌ・エー Editing Models with Task Arithmetic

AI 2 • 阿部佑樹 • 経歴 ◦ 慶應義塾大学今井研究室
◦ 2021年 DeNA入社 • 趣味 ◦ コンペティション参加 @yabea ◦ ゲーム ▪ スプラ ▪ ポケスリ ◦ ポーカー自己紹介

AI 3 G. Ilharco, M. Ribeiro, M. Wortsman, L. Schmidt,
H. Hajishirzi, and A. Farhadi, "Editing models with task arithmetic" inProc. of ICLR, 2023. 紹介論文: Editing Models with Task Arithmetic ※ 本スライドにおいて注釈がない画像は全て論文から引用したものです • Task Arithmetic という性質を画像や言語の幅広い分野で実験的に証明 ◦ 重みの引き算による忘却 ◦ 重みの足し算による学習 ◦ タスクのアナロジーの活用 • ICLR 2023 採択 https://iclr.cc/virtual/2023/poster/12254

AI 4 項目 01｜タスクベクトルについて 02｜減算による忘却 03｜加算による学習 04｜タスクのアナロジーの活用

AI 5 01 タスクベクトルについて

AI 6 • タスクベクトル ◦ ファインチューンによって更新した分の重み ◦ [Task vector] =
[Fine-tuned weight] - [Pre-trained weight] • アーキテクチャが同じモデル間で要素ごとの加算が可能 ◦ [New model] = [Old model] + λ [Task vector] ◦ λ はハイパラ ▪ 実験ではValidationデータで調整タスクベクトルとは

AI 7 02 減算による忘却

AI 8 • モデルから望ましくないバイアスや挙動のみを取り除く ◦ 例： ▪ 画像分類の結果がOCRに引っ張られることを抑制したい ▪ 言語モデルにおいて有害なコメントを生成する挙動を抑制したい
• タスクベクトルを減算することで実現 ◦ [New model] = [Old model] - λ [Task vector] = [Old model] - λ ([Fine-tuned] - [Old model]) 減算による忘却とはタスクベクトルを展開

AI 9 • CLIPを利用 ◦ SUN-397の画像に誤答クラス名を文字入れ ◦ [New model] =
[CLIP] - λ ([文字入れクラス名を当てるファインチューンをしたCLIP] - [CLIP]) • ImageNet精度を損なうことなくOCRへの依存を抑制画像分類における忘却実験画像引用元 https://openai.com/research/clip

AI 10 • GPT-2を利用 ◦ Civil Commentsデータセットのtoxicity>0.8でLM ◦ [New model]
= [GPT-2] - λ ([有害テキストを生成するようにファインチューンしたGPT-2] - [GPT-2]) • WikiTextのperplexityを損なうことなくtoxicityを抑制文章生成における忘却実験 toxicity -4%削減ほぼ性能悪化せず

AI 11 03 加算による学習

AI 12 • タスクベクトルの加算でモデルの性能を向上させる ◦ マルチタスクモデル化 ◦ シングルタスクの精度向上 • 複数のタスクベクトルを加算することで実現
◦ [New model] = [Old model] + λ (SUM([Task vector 1], ...)) 加算による学習とは

AI 13 • CLIPを使用 ◦ 8つのタスクで個別にファインチューン→8つのタスクベクトル ◦ 8C2個のタスクペアでタスクベクトルの加算を実行 ▪ [New
model] = [CLIP] + λ ([Task vector 1] + [Task vector 2]) • 個別モデルとほぼ同等の精度でデュアルタスク化に成功画像分類におけるマルチタスクモデル化実験個別にファインチューンしたモデルの精度を1.0とする Zero-shotは相対精度0.69くらい Task 1,2 の両方で相対精度0.99くらい

AI 14 • T5ベースのモデルを使用 ◦ GLUEの4つのタスクで個別にファインチューンしたものを始点 ◦ HuggingFaceから互換性のある重み427個を取得 ▪ 427個のタスクベクトルを検証スコアが最大になるよう選択し加算
• 個別モデルから更に精度が向上 GLUEベンチマークにおける精度向上実験精度向上

AI 15 04 タスクのアナロジーの活用

AI 16 • タスクDを解くモデルDを作りたい ◦ タスクDはデータが全く／ほとんどない ◦ “A is to
B as C is to D”を満たすタスクA~CのモデルA~Cはある • モデルA~Cの加減算でモデルDを表現 “A is to B as C is to D” [タスクD] = [タスクC] + ([タスクB] - [タスクA])

AI 17 • T5ベースのモデルを使用 ◦ Yelpの感情分類をzero-shotで解く ▪ Yelpはラベルのみない状況 ▪ Amazonの感情分類の教師データあり
◦ [Yelp;sent] = [Yelp;LM] + λ ([Amazon;sent] - [Amazon;LM]) • Yelpの感情分類をファインチューンしたモデルに匹敵する精度文章感情分類におけるタスクアナロジーの実験 Yelp;LM, Amazon;sent, Amazon;LMを同時に訓練（入力データがAmazonなら感情分類タスクも解く）

AI 18 • CLIPを使用 ◦ ImageNetとHuman SketchからA~Dの4つのタスクを作成 ◦ A~Dのどれをターゲットにするかで計4つの実験 ▪
[D: Sketch 2] = [C: Image 2] + λ ([B: Sketch 1] - [A: Real 1]) ▪ [D: Sketch 2] と [CLIP] のそれぞれで Few-shot Learning • Zero-/Few-shotでタスクベクトル作モデルが常に良い精度画像分類におけるタスクアナロジーの実験タスクアナロジーモデル ≒ 教師ありデータ100件モデルラベルグループ① ラベルグループ② ImageNet A C Human Sketch B D dog, apple, ... lion, castle, ... グループ分けのイメージ

AI 19 まとめ

AI 20 • Editing Models with Task Arithmetic の論文を紹介 •
重みの加減算でタスクの学習や忘却が可能まとめ

論文紹介 Editing Models with Task Arithmetic

論文紹介 Editing Models with Task Arithmetic

yabea

More Decks by yabea

Other Decks in Programming

Featured

Transcript

AI 2023.04.21 Yuki Abe 株式会社ディー・エヌ・エー Editing Models with Task Arithmetic

AI 2 • 阿部佑樹 • 経歴 ◦ 慶應義塾大学今井研究室

AI 3 G. Ilharco, M. Ribeiro, M. Wortsman, L. Schmidt,

AI 4 項目 01｜タスクベクトルについて 02｜減算による忘却 03｜加算による学習 04｜タスクのアナロジーの活用

AI 5 01 タスクベクトルについて

AI 6 • タスクベクトル ◦ ファインチューンによって更新した分の重み ◦ [Task vector] =

AI 7 02 減算による忘却

AI 8 • モデルから望ましくないバイアスや挙動のみを取り除く ◦ 例： ▪ 画像分類の結果がOCRに引っ張られることを抑制したい ▪ 言語モデルにおいて有害なコメントを生成する挙動を抑制したい

AI 9 • CLIPを利用 ◦ SUN-397の画像に誤答クラス名を文字入れ ◦ [New model] =

AI 10 • GPT-2を利用 ◦ Civil Commentsデータセットのtoxicity>0.8でLM ◦ [New model]

AI 11 03 加算による学習

AI 12 • タスクベクトルの加算でモデルの性能を向上させる ◦ マルチタスクモデル化 ◦ シングルタスクの精度向上 • 複数のタスクベクトルを加算することで実現

AI 13 • CLIPを使用 ◦ 8つのタスクで個別にファインチューン→8つのタスクベクトル ◦ 8C2個のタスクペアでタスクベクトルの加算を実行 ▪ [New

AI 14 • T5ベースのモデルを使用 ◦ GLUEの4つのタスクで個別にファインチューンしたものを始点 ◦ HuggingFaceから互換性のある重み427個を取得 ▪ 427個のタスクベクトルを検証スコアが最大になるよう選択し加算

AI 15 04 タスクのアナロジーの活用

AI 16 • タスクDを解くモデルDを作りたい ◦ タスクDはデータが全く／ほとんどない ◦ “A is to

AI 17 • T5ベースのモデルを使用 ◦ Yelpの感情分類をzero-shotで解く ▪ Yelpはラベルのみない状況 ▪ Amazonの感情分類の教師データあり

AI 18 • CLIPを使用 ◦ ImageNetとHuman SketchからA~Dの4つのタスクを作成 ◦ A~Dのどれをターゲットにするかで計4つの実験 ▪

AI 19 まとめ

AI 20 • Editing Models with Task Arithmetic の論文を紹介 •