Slide 53
Slide 53 text
AI 53
AudioSeal - loss - EnCodecと同じものってなんだよ
▪ 2種類のloss
▪ Perceptual losses
▪ 透かしの有無で聴覚上の差が小さくなるようにする
▪ EnCodecと同じもの + TF-Loudness
▪ Detection loss
▪ 各時刻に透かしがあるか/埋め込まれたメッセージは何か正しく判定できるようにする
▪ 普通にバイナリクロスエントロピー
波形の L1 loss
メルスペクトログラムの L1 loss, L2 loss
GAN の Hinge loss
EnCodecと一緒ならFeature matching lossも
あるはずだが……? :thinking_face:
図は Défossez, et al. “High Fidelity Neural
Audio Compression,” arXiv preprint
arXiv:2210.13438, 2022. より引用