Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Diffusion Model with Perceptual Loss
Search
Henry Cui
January 26, 2024
Research
0
190
Diffusion Model with Perceptual Loss
Henry Cui
January 26, 2024
Tweet
Share
More Decks by Henry Cui
See All by Henry Cui
プロダクション言語モデルの情報を盗む攻撃 / Stealing Part of a Production Language Model
zchenry
0
57
Direct Preference Optimization
zchenry
0
250
レンズの下のLLM / LLM under the Lens
zchenry
0
140
Go with the Prompt Flow
zchenry
0
130
Mojo Dojo
zchenry
1
170
ことのはの力で画像の異常検知 / Anomaly Detection by Language
zchenry
0
310
驚愕の事実!LangChainが抱える問題 / Problems of LangChain
zchenry
0
160
MLOps初心者がMLflowを触る / MLflow Brief Introduction
zchenry
0
77
{{guidance}}のガイダンス / Guidance of guidance
zchenry
0
140
Other Decks in Research
See All in Research
LLM時代の半導体・集積回路
kentaroy47
1
380
Minimum Bayes-Risk Decoding における性能変動の理解に向けて(2024年6月5日 第59回 NLPコロキウム)
atsumoto
0
300
DiscordにおけるキャラクターIPを活用したUGCコンテンツ生成サービスの ラピッドプロトタイピング ~国際ハッカソンでの事例研究
o_ob
0
210
秘伝:脆弱性診断をうまく活用してセキュリティを確保するには
okdt
PRO
2
620
SSII2024 [OS3] 企業における基盤モデル開発の実際
ssii
PRO
0
550
DroidKaigi CfP分析
yukihiromori
0
130
MIRU2024チュートリアル「様々なセンサやモダリティを用いたシーン状態推定」
miso2024
3
1.9k
SSII2024 [OS1] 現場の課題を解決する ロボットラーニング
ssii
PRO
0
500
授業評価アンケートのテキストマイニング
langstat
1
310
[CV勉強会@関東 CVPR2024] Visual Layout Composer: Image-Vector Dual Diffusion Model for Design Layout Generation / kantocv 61th CVPR 2024
shunk031
1
270
【ICASSP2024】音声変換に関する全論文まとめ【Parakeet株式会社】
supikiti
0
690
Weekly AI Agents News!
masatoto
21
16k
Featured
See All Featured
Speed Design
sergeychernyshev
18
400
What's in a price? How to price your products and services
michaelherold
241
11k
Building an army of robots
kneath
302
42k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
We Have a Design System, Now What?
morganepeng
48
7.1k
Making Projects Easy
brettharned
113
5.8k
The Cost Of JavaScript in 2023
addyosmani
39
5.1k
How GitHub (no longer) Works
holman
309
140k
Rails Girls Zürich Keynote
gr2m
93
13k
The Power of CSS Pseudo Elements
geoffreycrofte
71
5.2k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
165
48k
Bash Introduction
62gerente
608
210k
Transcript
Diffusion Model with Perceptual Loss 機械学習の社会実装勉強会第31回 Henry 2024/1/27
論文の紹介 ▪ Diffusion Model with Perceptual Loss, Lin and Yang
▪ ByteDanceの研究者が去年12月30日にarxivに投稿 ▪ Diffusionモデルの損失関数を改良 2
提案モチベーション ▪ 下図のように既存の損失関数では分布の多峰性を学習でき ない 3
従来の損失関数 ▪ 予測したい目標(拡散過程で発生するノイズ)のMSE ▪ 拡散する式 ▪ 予測したい目標 ▪ MSE損失 4
提案の損失関数 ▪ 学習済み重みで抽出する中間層でのMSE ▪ 予測された値で、拡散ステップの最初に戻してから拡散させる ▪ 学習済み重みで中間特徴量を取り出してMSEを取る ▪ 考察 •
差分は拡散過程を戻すのと中間層を使うの2箇所ある • 著者がこの損失関数をperceptualと解釈する 5
定量評価 ▪ Vanilla MSEよりよいが、Classifier-free guidanced MSEに 負けてしまう 6
Ablation Study 抜粋 ▪ 下記項目を変えて実験したが、CFG MSEには勝てなかった • 中間層、拡散ステップ、距離関数(Mean Absolute Distance)、差分を
取る特徴量、学習済みモデル ▪ CFG + 提案方でも負けてしまう 7
まとめ ▪ Diffusion Modelの損失関数を改良する提案手法 ▪ 中間層を使うヒントになる 8