Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介 Editing Models with Task Arithmetic
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
yabea
February 15, 2024
Programming
940
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
論文紹介 Editing Models with Task Arithmetic
yabea
February 15, 2024
More Decks by yabea
See All by yabea
Generative Dog Images 2nd place solution (Japanese)
yabea
3
690
Other Decks in Programming
See All in Programming
net-httpのHTTP/2対応について
naruse
0
480
肥大化するレガシーコードに立ち向かうためのインターフェース分離と依存の逆転 / JJUG CCC 2026 Spring
hirokunimaeta
0
560
Inside Stream API
skrb
1
720
決定論的オーケストレーションの設計と実装 / Design and Implementation of Deterministic Orchestration
nrslib
4
1.4k
[2026年度第1回ORセミナー] 計画最適化ベンチャーと競技プログラミング人材
terryu16
0
260
「なぜそう決めたのか」を残し続ける仕組み ― Notion AI カスタムエージェント × Slack連携による設計判断の自動記録 - NIKKEI Tech Talk #47
niftycorp
PRO
0
170
A2UI という光を覗いてみる
satohjohn
1
140
ユニットテストの先へ:テスト技法で要求・仕様を整理するJava開発実践 / Beyond_Unit_Testing_Practical_Java_Development_Techniques_for_Organizing_Requirements_and_Specifications
shimashima35
0
400
Agentic UI
manfredsteyer
PRO
0
160
さぁV100、メモリをお食べ・・・
nilpe
0
140
The ROI of Quarkus for Spring Boot Applications
hollycummins
0
120
LLMによるContent Moderationの本番運用の裏側と品質担保への挑戦
suikabar
3
680
Featured
See All Featured
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
Why Our Code Smells
bkeepers
PRO
340
58k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
4 Signs Your Business is Dying
shpigford
187
22k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.3k
Done Done
chrislema
186
16k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.4k
A Tale of Four Properties
chriscoyier
163
24k
RailsConf 2023
tenderlove
30
1.5k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
390
Un-Boring Meetings
codingconduct
0
310
Transcript
AI 2023.04.21 Yuki Abe 株式会社ディー・エヌ・エー Editing Models with Task Arithmetic
AI 2 • 阿部 佑樹 • 経歴 ◦ 慶應義塾大学 今井研究室
◦ 2021年 DeNA入社 • 趣味 ◦ コンペティション参加 @yabea ◦ ゲーム ▪ スプラ ▪ ポケスリ ◦ ポーカー 自己紹介
AI 3 G. Ilharco, M. Ribeiro, M. Wortsman, L. Schmidt,
H. Hajishirzi, and A. Farhadi, "Editing models with task arithmetic" inProc. of ICLR, 2023. 紹介論文: Editing Models with Task Arithmetic ※ 本スライドにおいて注釈がない画像は全て論文から引用したものです • Task Arithmetic という性質を画像や言語の幅広い分野で実験的に証明 ◦ 重みの引き算による忘却 ◦ 重みの足し算による学習 ◦ タスクのアナロジーの活用 • ICLR 2023 採択 https://iclr.cc/virtual/2023/poster/12254
AI 4 項目 01|タスクベクトルについて 02|減算による忘却 03|加算による学習 04|タスクのアナロジーの活用
AI 5 01 タスクベクトルについて
AI 6 • タスクベクトル ◦ ファインチューンによって更新した分の重み ◦ [Task vector] =
[Fine-tuned weight] - [Pre-trained weight] • アーキテクチャが同じモデル間で要素ごとの加算が可能 ◦ [New model] = [Old model] + λ [Task vector] ◦ λ はハイパラ ▪ 実験ではValidationデータで調整 タスクベクトルとは
AI 7 02 減算による忘却
AI 8 • モデルから望ましくないバイアスや挙動のみを取り除く ◦ 例: ▪ 画像分類の結果がOCRに引っ張られることを抑制したい ▪ 言語モデルにおいて有害なコメントを生成する挙動を抑制したい
• タスクベクトルを減算することで実現 ◦ [New model] = [Old model] - λ [Task vector] = [Old model] - λ ([Fine-tuned] - [Old model]) 減算による忘却とは タスクベクトル を展開
AI 9 • CLIPを利用 ◦ SUN-397の画像に誤答クラス名を文字入れ ◦ [New model] =
[CLIP] - λ ([文字入れクラス名を当てるファインチュー ンをしたCLIP] - [CLIP]) • ImageNet精度を損なうことなくOCRへの依存を抑制 画像分類における忘却実験 画像引用元 https://openai.com/research/clip
AI 10 • GPT-2を利用 ◦ Civil Commentsデータセットのtoxicity>0.8でLM ◦ [New model]
= [GPT-2] - λ ([有害テキストを生成するようにファイン チューンしたGPT-2] - [GPT-2]) • WikiTextのperplexityを損なうことなくtoxicityを抑制 文章生成における忘却実験 toxicity -4%削減 ほぼ性能 悪化せず
AI 11 03 加算による学習
AI 12 • タスクベクトルの加算でモデルの性能を向上させる ◦ マルチタスクモデル化 ◦ シングルタスクの精度向上 • 複数のタスクベクトルを加算することで実現
◦ [New model] = [Old model] + λ (SUM([Task vector 1], ...)) 加算による学習とは
AI 13 • CLIPを使用 ◦ 8つのタスクで個別にファインチューン→8つのタスクベクトル ◦ 8C2個のタスクペアでタスクベクトルの加算を実行 ▪ [New
model] = [CLIP] + λ ([Task vector 1] + [Task vector 2]) • 個別モデルとほぼ同等の精度でデュアルタスク化に成功 画像分類におけるマルチタスクモデル化実験 個別にファインチューンした モデルの精度を1.0とする Zero-shotは相対精度0.69くらい Task 1,2 の両方で相対精度0.99くらい
AI 14 • T5ベースのモデルを使用 ◦ GLUEの4つのタスクで個別にファインチューンしたものを始点 ◦ HuggingFaceから互換性のある重み427個を取得 ▪ 427個のタスクベクトルを検証スコアが最大になるよう選択し加算
• 個別モデルから更に精度が向上 GLUEベンチマークにおける精度向上実験 精度向上
AI 15 04 タスクのアナロジーの活用
AI 16 • タスクDを解くモデルDを作りたい ◦ タスクDはデータが全く/ほとんどない ◦ “A is to
B as C is to D”を満たすタスクA~CのモデルA~Cはある • モデルA~Cの加減算でモデルDを表現 “A is to B as C is to D” [タスクD] = [タスクC] + ([タスクB] - [タスクA])
AI 17 • T5ベースのモデルを使用 ◦ Yelpの感情分類をzero-shotで解く ▪ Yelpはラベルのみない状況 ▪ Amazonの感情分類の教師データあり
◦ [Yelp;sent] = [Yelp;LM] + λ ([Amazon;sent] - [Amazon;LM]) • Yelpの感情分類をファインチューンしたモデルに匹敵する精度 文章感情分類におけるタスクアナロジーの実験 Yelp;LM, Amazon;sent, Amazon;LMを同時に訓練 (入力データがAmazonなら 感情分類タスクも解く)
AI 18 • CLIPを使用 ◦ ImageNetとHuman SketchからA~Dの4つのタスクを作成 ◦ A~Dのどれをターゲットにするかで計4つの実験 ▪
[D: Sketch 2] = [C: Image 2] + λ ([B: Sketch 1] - [A: Real 1]) ▪ [D: Sketch 2] と [CLIP] のそれぞれで Few-shot Learning • Zero-/Few-shotでタスクベクトル作モデルが常に良い精度 画像分類におけるタスクアナロジーの実験 タスクアナロジーモデル ≒ 教師ありデータ100件モデル ラベル グループ① ラベル グループ② ImageNet A C Human Sketch B D dog, apple, ... lion, castle, ... グループ分けのイメージ
AI 19 まとめ
AI 20 • Editing Models with Task Arithmetic の論文を紹介 •
重みの加減算でタスクの学習や忘却が可能 まとめ