Slide 50
Slide 50 text
超高次元データの生成モデル
音声波形や画像は超高次元なデータ
音声波形(44.1kHzサンプリング)の場合: わずか1秒間で40,000次元
画像(1024x1024ピクセル)の場合: 1,000,000次元
高次元であるだけでなく複雑な相関構造(つまり同時分布)をもつ
各種深層生成モデルのアイディア
AGN
のようにfactorizeしてモデル化・学習の対象
を1次元の分布 に帰着させることで問題を簡単化
学習できたら により を生成可能
VAE
要素間に相関構造や制約がある高次元データは低次元空間に圧縮可能という考え方
符号化器 と復号化器
の をNNでモデル化し,
となるように , を学習
学習できたら により を生成可能
Flow, GANは?
⇒どうやって , … , の複雑な分布 をモデル化するか?
⇒本日はFlow, GANの考え方について解説