論文紹介:The Effect of Gradient Noise on the Energy Landscape of Deep Networks
2016/09/20の論文紹介ゼミで使用したスライドです.
論文:P. Chaudhari and S. Soatto, “The Effect of Gradient Noise on the Energy Landscape of Deep Networks,” Preprint:arXiv1511.06485v4, Nov. 2015.
隠れ層は20個 o 1層あたりのユニット数はMNISTが64個, CIFER-10が128個 o 活性化関数はReLU o 最適化法はAdam o バッチサイズは1024 • 50epochの結果,10回分を平均してグラフ化 35 Sec.5.2 Fully-connected deep networks