Flow-based deep generative model, NICE & Real NVP and its Application to Material Science

We briefly introduced flow-based deep generative model, NICE & Real NVP and its recent application to material science in previous statistics seminar.

Yuhei Tachi

August 09, 2019

  1. このスライドの目的とモチベーション 2 Ø  目的 1.  機械学習や深層学習を勉強している方にFlow-based generative modelとは何か、 概観を知ってもらう 2. 

    今回紹介する生成モデルではどんな応用が可能か?について議論をする Ø  モチベーション 1.  扱いやすく精度の良いモデルは今後一定の需要がある 2.  1.の性質を利用して物質科学分野で昨今応用が報告されており、データ収集にコスト が高い領域で重要になるかもしれない
  2. Flow-based deep generative modelは 厳密なサンプリングや推論、対数尤度の評価が可能です 5 ポイント: Real NVPとNICEは正規化フロー(Normalizing flow)を特徴としてもつ

    扱いやすい性質と性能を両立する代表的なモデルです 学習するモデル 学習方法 潜在変数への推論 RBM エネルギー関数 対数尤度の最大化 (CD法) 可能 VAE 生成モデル 推論モデル ELBOの最大化 近似事後分布(推論分布) によって可能 GAN 生成モデル 識別モデル 敵対的学習 推論はモデル化されない NICE & RealNVP 正規化フロー (Normalizing flow) 対数尤度の最大化 フローの逆変換で可能 Ø  代表的な深層生成モデルとの比較
  3. 皆さん、変数変換の公式を思い出しましょう 6 観測された変数 が与えられ、潜在変数 上での確率密度関数 に従うとき 全単射 を考えると、 上の確率密度関数は変数変換の公式 から以下で与えられ、

    両辺の対数を取れば、以下のようになる。右式第二項目はヤコビアン(Jacobian) (a+c, b+d) (a, b) (c, d) (0, 0) 1 1 ad-bc Shift only Scale ü  公式のイメージ: ヤコビヤンは変換前後 で空間が伸び縮みする 変化を打ち消す
  4. NICE Real NVP Real-valued non-volume preserving (Real NVP) [7]は Affine

    coupling layerを特徴として持つFlow-based深層生成モデルです 8 NICE [8]ではAddictive coupling layerを採用し、各レイヤーの変換前後で体積が保存されるが、 (volume preserving)が、Affine coupling layerは非体積保存(non-volume preserving)で ヤコビアンの行列式はその対角成分の和として計算できる : transformation from i to j, : its Jacobian determinant concat Affine coupling layer x z S T x1 x2 z1 z2 ◉ + f f-1 p p-1 f f-1 f f-1 ・・・ ・・・ Permutation layer pを交互に挟み、全次元に対して変換可能なアーキテクチャを構成する Forward transformation Fxz Inverse transformation Fzx
  5. 近年の物質科学への代表的な応用として Boltzman分布に従う分子構造集団の生成が報告されています[9] 10 通常、分子動力学(MD)法やMonte Carlo(MC)法のようなシミュレーションによって 分子構造集団をサンプルするが、それらの計算コストを削減することが可能となる Ø  Cyclononane C9 H18

    における結果: 黒色のデータ:生成モデルからのデータ 赤色のデータ:シミュレーションからのデータ Ø  ロス関数: 1.  尤度ロス 2.  Kullback-Leibler (KL) divergence Ø  学習データ: 立体構造・ポテンシャルエネルギーデータ
  6. Flow-based Markov Chain Monte Carlo (MCMC)によって 厳密な確率分布を生成モデルから生成し、期待値を算出可能です[10] 11 従来までのMCMCではシステムサイズLが大きくなると相関時間が長くなるが、 Flow-based

    MCMCでは一定的であり、より大きなシステムでメリットがより大きい Ø  格子場のサンプリングにおけるFlow-based MCMCの概念図 Ø  Local Metroplis, Hamiltonian MC , Flow-based MCMCに おけるアンサンブルの相関時間のシステムサイズ依存性 ü  Flow-based MCMCの受諾確率 以下の確率で提案された状態を受託し アンサンブルを構成する。
  7. 本スライドのまとめ 12 1.  生成モデルではデータが未知の確率分布から生成されていると仮定し、その分布の モデルを学習する 2.  Flow-based deep generative modelは厳密なサンプリングや推論、対数尤度の評価

    可能という点で扱いやすい生成モデルである 3.  Real NVPはAffine coupling layer、NICEではAddictive coupling layerを特徴として持つ Flow-based深層生成モデルである 4.  鮮明な画像生成の他、物質科学への応用として分子構造や格子場の生成なども報告 されており、効率的なサンプリングに有益であることが分かってきた
  8. 参考文献 13 [1] D. P. Kingma, and P. Dhariwal, Glow:

    Generative Flow with Invertible 1×1 Convolutions. arXiv preprint, arXiv:1807.03039v2 (2018). [2] J. Regier, et al., Celeste: Variational inference for a generative model of astronomical images. arXiv preprint, arXiv:1506.01351 (2015). [3] A. van den Oord, et al. WaveNet: A Generative Model for Raw Audio. arXiv preprint, arXiv:1609.03499 (2016). [4] R. Gómez-Bombarelli, et al. Automatic chemical design using a data-driven continuous representation of molecules. arXiv preprint, arXiv:1610.02415x3 (2016). [5] https://www.youtube.com/watch?v=JrO5fSskISY [6] http://www.shakirm.com/slides/DeepGenModelsTutorial.pdf [7] L. Dinh, L. Sohl-Dickstein, and S. Bengio, Density estimation using Real NVP. arXiv preprint, arXiv:1605.08803 (2016). [8] L. Dinh, D. Krueger, and Y. Bengio, Nice: non-linear independent components estimation. arXiv preprint, arXiv:1410.8516 (2014). [9] F. Noe and H. Wu, Boltzmann Generators – Sampling Equilibrium States of Many- Body Systems with Deep Learning. arXiv preprint, arXiv:1812.01729 (2018). [10] M. S. Albergo, G. Kanwar, and P. E. Shanahan, Flow-based generative models for Markov chain Monte Carlo in lattice field theory. arXiv preprint, arXiv: 1904.12072v2 (2019).