Slide 5
Slide 5 text
5
提案手法 準備① VQ-VAE [van den Oord+ 2017]
• Latent Action Model, Video Tokenizer で利用
• 𝐾 本の埋め込みからなる VQ-codebook を用意し,エンコーダの出力を最も近い
VQ-codebook 内の埋め込みに対応するインデックスに変換
• Posterior Collapse という,強い decoder を使うときに潜在変数が無視される
現象を回避
[van den Oord+ 2017] van den Oord, Aaron, et al. “Neural Discrete Representation Learning.” Advances in Neural Information Processing Systems, vol. 30, 2017.
ベクトル量子化により,VAE の潜在変数を離散化