【深度學習】07 生成模式和 GAN

政⼤應數。數學軟體應⽤蔡炎龍⽣成模式和 GAN 政治⼤學應⽤數學系深度學習入⾨ 07.

⽣成模式和特徵截取 20.

數學軟體應⽤ 451 ⽣成模式 Generative Models Generative Models 為何要討論這個呢?

數學軟體應⽤ 452 討論⽣成模式⼀定要引費曼的話 What I cannot create, I do not
understand.” “ —Richard Feynman

數學軟體應⽤ 453 ⽣成模式 G  ⽣成器⽣出圖、照片、⽂字 z latent vector 特徵向
/本徵向

數學軟體應⽤ 454 輸入的特徵向基本上有兩種作法生成器 Noise 生出圖、照片、文字亂亂做! (保證生出「正確格式」的東⻄就好) ⽅法⼀
隨機輸入⼀堆數字。在 GAN 裡, 這是最常⽤的⽅法!

數學軟體應⽤ 455 輸入的特徵向基本上有兩種作法 Encoder ⽅法⼆先想辦法做個「好的」特徵向出來!
特徵向量

數學軟體應⽤ 456 Autoencoder ⽅法⼆看來有點神奇, 怎麼能訓練⼀個截取特徵向的函數的? 這裡介紹⼀個常⽤⼿法叫⾃編碼器 (Autoencoder)。
Autoencoder

數學軟體應⽤ 457 Autoencoder encoder decoder z latent vector x m
>> k k維 x m維於是, z 可以取代 x (或者說 z 是 x 的一個 presentation) Autoencoder 是輸入什麼, 就輸出什麼的函數。感覺很奇怪, 原來是中間我們會⽤⼀層比較⼩的維神經元。這⼀層的輸出就是我們準備當特徵向的。 k

數學軟體應⽤ 458 Autoencoder encoder z x 以後我們基本上可以⽤比較⼩的 z 來取代
比較⼤的 x。特徵向就這麼找出來了。

數學軟體應⽤ 459 Autoencoder 另⼀邊就可以當⽣成器, 輸入⼀個特徵向 , 就⽣出⼀個我們要的圖或任何東⻄。假設我們有隻兔⼦
的特徵向 , 改⼀點點會不會⽣出⼀隻很像的兔⼦? decoder z x

數學軟體應⽤ 460 Autoencoder 答案是不太⾏隨便⽣兩個 latent vectors, 數學上距離很近, 但⽣出來的東⻄不⼀
定有什麼關係。白話文是 z 差不多就是亂數, 我們無以掌控。

數學軟體應⽤ 461 VAE (Variational AutoEncoder) 所以有了 VAE Variational AutoEncoder

數學軟體應⽤ 462 VAE (Variational AutoEncoder) 我們想辦法找每個數的平均值和變異數 (or 標準差) 神秘編碼
laten vector 每個數字是符合某常態分布的, 這樣我們容易掌控! 這要怎麼做到?

數學軟體應⽤ 463 VAE (Variational AutoEncoder) encoder z x k維 m維
μ σ 在 encoder 後做點手腳。 laten vector 其實這層還有加 noise 其實就是要函數學習機去學平均值和變異數!

數學軟體應⽤ 464 Deepfake 可以⽤ Autoencoder 就做出來 encoder A decoder A
encoder B decoder B ⽤ autoencoder 就可以做到 deepfake

數學軟體應⽤ 465 Deepfake 可以⽤ Autoencoder 就做出來 encoder A decoder B
⽤ encoder A 做出的 latent vector, 送進 decoder B 之中。

⽣成對抗網路 GAN 21.

數學軟體應⽤ 467 LeCun 認為 GAN 是深度學習最有潛⼒的 model There are many
interesting recent development in deep learning… The most important one, in my opinion, is adversarial training (also called GAN for Generative Adversarial Networks). “ —Yan LeCun (楊⽴昆), 2016 ”

數學軟體應⽤ 468 GAN 的架構⽣成器 generator Noise 鑑別器 discriminator GAN
是兩個神經網路, ⼀個叫⽣成器、⼀個叫鑑別器, 相互對抗! G D z G(z) x 1 真的 0 假的 or

數學軟體應⽤ 469 GAN 就是⽣成器、鑑別器⼤對抗! 希望接近 1 希望接近 0
接近 1 ⽣成器 G 鑑別器 D

數學軟體應⽤ 470 GAN 的著名應⽤接下來介紹幾個 GAN 的著名應⽤!

數學軟體應⽤ 471 iGAN ⼈⼈都是⼤畫家! 人人都是大畫家! https://youtu.be/9c4z6YsBGQ0 朱俊彦等人 (ECCV 2016) “Generative
Visual Manipulation on the Natural Image Manifold” iGAN https://arxiv.org/abs/1609.03552

數學軟體應⽤ 472 Progressive GAN ⽣成明星照片 Karras-Aila-Laine-Lehtinen NVIDIA 團隊很有名的⽂章當初⽤現在基本上沒有在⽤的 Theano,
Python 2, ⽽且只有單 GPU Progressive Growing of GANs for Improved Quality, Stability, and Variation Karras 等 NVIDIA 團隊 (ICLR 2018) “Progressive Growing of GANs for Improved Quality, Stability, and Variation” Progressive GAN https://arxiv.org/abs/1710.10196

數學軟體應⽤ 473 Progressive GAN ⽣成明星照片這攏係假ㄟ啦 (1024x1024 明星照)

數學軟體應⽤ 474 然後越來越誇張 (StyleGAN2) https://thispersondoesnotexist.com/

數學軟體應⽤ 475 This X Does Not Exist AI ⽣出各種不同的
X!

數學軟體應⽤ 476 ⼈臉變迪⼠尼風格! https://bit.ly/colab_toonify 魏澤⼈老師整理成 Colab Notebook:

數學軟體應⽤ 477 Pix2pix: 簡單畫畫就產⽣很真實的相片 * 來自 Isola, 朱俊彦等人的原始論文 (2017) Pix2pix
把衛星圖變地圖。 Isola, 朱俊彦等人 (CVPR 2017) “Image-to-Image Translation with Conditional Adversarial Networks” Pix2Pix https://arxiv.org/abs/1611.07004

數學軟體應⽤ 478 Pix2pix: 簡單畫畫就產⽣很真實的相片⽣成器 generator G 鑑別器 discriminator D
Real 注意輸入輸出需同時送進鑑別器。

數學軟體應⽤ 479 Pix2pix: 簡單畫畫就產⽣很真實的相片 * 來自 Isola, 朱俊彦等人的原始論文 (2017) Pix2pix
隨手畫畫變街景。可以訓練⾃駕⾞!

數學軟體應⽤ 480 Pix2pix: 簡單畫畫就產⽣很真實的相片 * Christopher Hesse 依原論文做出 Pix2pix 線上版。
https://affinelayer.com/pixsrv/ ⾃⼰試試看, 可不可以⽣出隻貓來!

數學軟體應⽤ 481 CycleGAN: 讓⼈驚呆的魔法朱俊彦等人 (ICCV 2017) “Unpaired Image-to-Image Translation
using Cycle-Consistent Adversarial Networks” CycleGAN https://arxiv.org/abs/1703.10593

數學軟體應⽤ 482 CycleGAN: 讓⼈驚呆的魔法 G  ⽣成器 F  ⽣成器 Domain A
Domain B 鑑別器 B 鑑別器 A CycleGAN 資料「不需要」配對! 於是有無限可能... 比如 “Cycle GAN” 般的機器翻譯!

數學軟體應⽤ 483 CycleGAN: 讓⼈驚呆的魔法全世界的⼈都驚呆了的⾺變斑⾺。 https://youtu.be/9reHvktowLY

數學軟體應⽤ 484 CycleGAN: 讓⼈驚呆的魔法 CycleGAN 作者群幽⾃⼰⼀默的失敗例⼦。

數學軟體應⽤ 485 CycleGAN: 讓⼈驚呆的魔法 Goodfellow 也關注的館長變陳沂 (魏澤⼈老師)。 https://youtu.be/Fea4kZq0oFQ

AI 新進發展: 尋找良好的 representation 22.

數學軟體應⽤ 487 表⽰向新進 AI 的發展, 很多是在追尋良好的表⽰向 !

數學軟體應⽤ 488 也就是訓練產⽣表⽰向的函數! f 表⽰向可以想成是電腦的「記憶」或是「理解」。我們真正要做的事
(比如分類), ⽤表⽰向可能會更簡單順利! 等等, 這不就是 feature engineering 嗎?

數學軟體應⽤ 489 還記得有⼈說... Deep learning 不太需要做 feature engineering。 f ⽤海
的資料讓電腦看著辦... 這位就「有⼈」

數學軟體應⽤ 490 Feature Engineering 神經網路某⼀隱藏層可以當⼀種 feature engineering 也就是說, 我們可以把神經網路在做「⾃動的」feature
engineering

數學軟體應⽤ 491 Feature Engineering 事實上可以想每⼀個隱藏層都在做 feature engineering。

數學軟體應⽤ 492 Representation Learning 神經網路就是⾃動的在做原始資料新的 representation。

數學軟體應⽤ 493 ⽂字我們做過類似的, 影像呢? 以後公司⾨禁就直接⽤⼈臉辨識! 假設我們要做⼈臉辨識。

數學軟體應⽤ 494 感覺挺容易的, 就給每個同仁⼀個編號 1 2 3 4

數學軟體應⽤ 495 就學這個函數 f 輸出輸入 3

數學軟體應⽤ 496 問題1 圖形辨識⼀個類別⼤約要 1000 張才能訓練! 我們總不能叫每位同仁都來個 1000
張照片...

數學軟體應⽤ 497 問題2 我是新加入的, 要新訓練嗎?

數學軟體應⽤ 498 這和⼈類不太⼀樣... ⼈好像不需要幾千張照片才能辨識...

數學軟體應⽤ 499 Meta Learning 有沒有可能教電腦「怎麼學習」? 學會了⼩數據也可以訓練。

數學軟體應⽤ 500 如果可以找到這樣的函數... f ̂ y 1 ̂ y 2
̂ y n 於是她就有個代表向 ̂ y = [ ̂ y 1 , ̂ y 2 , …, ̂ y n]

數學軟體應⽤ 501 每個⼈就有個「代表向」假設是公司內四位同仁的照片。 x 1 , x
2 , x 3 , x 4 f(x 1 ) f(x 2 ) f(x 3 ) f(x 4 ) f ̂ y 1 ̂ y 2 ̂ y n 看和哪個距離最⼩!

數學軟體應⽤ 502 於是種種問題就解決了! 比⽅說有新⼈來了, 我們就⽤訓練好的這個神經網路做她的代表向。 f ̂ y
1 ̂ y 2 ̂ y n

數學軟體應⽤ 503 還有個立即的好處我們可以規定, 什麼才叫「夠像」。就是定義⼀個數 , 如果 τ d(f(x), f(x
i )) < τ 就判定是這個⼈。所以, 我們也可以知道, 這個⼈判斷這個⼈不是公司內部的⼈。

數學軟體應⽤ 504 但是訓練資料難以準備... 我怎麼知道什麼是代表她最好的向 ?

數學軟體應⽤ 505 ⾃動特徵擷取機神經網路可以想成每個隱藏層在做「⾃動特徵擷取」。所以某個隱藏層的輸出, 可以看成原資料的代表向 !

數學軟體應⽤ 506 從⽂字的 Word Embedding 得到的靈感... CNN ̂ y 1
̂ y 2 ̂ y n Dense Output (Softmax) 砍掉最後⼀層就可以! 做「正常」的⼈臉辨識, 然後砍掉最後⼀層!

數學軟體應⽤ 507 也可以直接就訓練判斷是否為同⼀個⼈ CNN ̂ y 1 ̂ y 2
̂ y n 砍掉最後⼀層就可以! CNN ̂ y 1 ̂ y 2 ̂ y n 0

數學軟體應⽤ 508 更好的是⽤ Triplet Loss CNN ̂ y 1 ̂
y 2 ̂ y n CNN ̂ y 1 ̂ y 2 ̂ y n CNN ̂ y 1 ̂ y 2 ̂ y n 越近越好越遠越好注意訓練時還是需要做 labeling

數學軟體應⽤ 509 更好的是⽤ Triplet Loss F. Schroff, D. Kalenichenko, J.
Philbin (Google). FaceNet: A Unified Embedding for Face Recognition and Clustering. arXiv preprint arXiv:1503.03832. CNN ̂ y 1 ̂ y 2 ̂ y n CNN ̂ y 1 ̂ y 2 ̂ y n Positive Sample Negative Sample

數學軟體應⽤ 510 更⼀般化就是 Contrastive Learning f θq g θk Target
的部份 Sample 的部份 q k 神經網路可以⼀樣、也可以不⼀樣。要有 negative samples 是為預防 collapse 的發⽣。

數學軟體應⽤ 511 Contrastive Learning sim(q, k) 定義⼀個「相似度」函數。可以是距離函數, 甚⾄⼤家
更常⽤內積。 ∥q − k∥2 ⟨q, k⟩ τ 1 2 例⼦

數學軟體應⽤ 512 Contrastive Learning ℒ(θ) = − log esim(q,k+) ∑
esim(q,k)

數學軟體應⽤ 513 我可以完全不做 labeling 嗎? 以上的想法, 我們可以⽤較少的 labeling (⼤約 1%),
就可以訓練出很好的 model。但是, 我可以不做 labeling 就來訓練嗎? 可以的, 就是把⼀張圖做各種惡搞, 不是, 轉換。也就是⼤家稱為 augmentation 的動作。旋轉裁切調亮度、顏⾊

數學軟體應⽤ 514 Self-Supervised Learning Contrastive learning 去學 representation 時, 我們只⽤少
labeling, 甚⾄不⽤ labeling。不管如何, 我們並沒有告訴神經網路, 任何⼀個 representation 是什麼, 因此, 這是非監督式的學習。但認真想想, 電腦其實是「⾃⼰訓練⾃⼰」, 所以 Yann LeCun 說這應該叫... self-supervised learning LeCun

數學軟體應⽤ 515 Self-Supervised Learning We believe that self-supervised learning is
one of the most promising ways to build such background knowledge and approximate a form of common sense in AI systems. “ —Yan LeCun (楊⽴昆)/Ishan Misra, 2021 ” Self-supervised Learning: The Dark Matter of Intelligence https://ai.facebook.com/blog/self-supervised- learning-the-dark-matter-of-intelligence/

數學軟體應⽤ 516 Non-Contrastive Learning 實作的時候, 會發現為了 negative samples, 有些技術上的問題 (雖然
也不算很⼤), 比如會⽤到很多記憶體、計算資源。於是⼤家想, 我們可以不要 negative samples, 但是⼜不會 collapse 嗎? f θq g θk q k x x+ P φ 預測

數學軟體應⽤ 517 推薦範例 http://bit.ly/yenlung colab08 ⽤ DeepFace 神速打造⼈臉辨識.ipynb Deep-Learning-Basics

【深度學習】07 生成模式和 GAN

【深度學習】07 生成模式和 GAN

More Decks by [email protected]

Other Decks in Technology

Featured

Transcript