TFUG_PPL_compare_HELLOCYBER.pdf

TFUG: ベイズ分科会 2020/9/6 ブログ : HELLO CYBERNETICS Twitter : ML_deep
やってます近年の PPL の動向

自己紹介 • 学生時代： Brain Computer Interface の分野 – 制御や最適化に興味があった（応用対象は問わず） –
流れの中で機械学習を学ぶことを決意（ブログ） • 今：ロボティクスの分野 – 制御や認識を扱っている興味の分野に戻ってきた – 逆に機械学習・確率モデリング楽しい

自己紹介 • 基本的に当該分野は独学です • むしろ教わりたいことが沢山あります • このウェビナーに参加できたのは光栄です（恐らく発表側でなければリアルタイムで参加しなかった）　須山さん、運営のみなさん。ありがとうございます。

目次 • PPL の役割と意義 • PPL 速度比較 • モデリング、推論 API
を簡単に比較 • Pyro で Gaussian Mixture Model の MCMC, ADVI

なぜ PPL を利用するのか ▪ データ分析の大まかな流れ – 仮説を構築 – データ収集 –
データと現象のモデリング – 推論実行 – 説明、予測実施

なぜ PPL を利用するのか ▪ データ分析の大まかな流れ – 仮説を構築 – データ収集 –
データと現象のモデリング – 推論実行 – 説明、予測実施ここを助けてもらうため近年データは複雑化・巨大化計算機が重要に

様々な PPL • Wikipedia 　 https://en.wikipedia.org/wiki/Probabilistic_programming　参照 , 一部抜粋近年は深層学習ライブラリベースの GPU
対応 PPL が出てきている • TensorFlow Probability (TensorFlow) • Pyro (PyTorch) • NumPyro (Jax) • PyMC4 (TensorFlow Probability) • Stan (TensorFlow Probability 予定？ ) 等

可視化ライブラリ ArviZ • 共通のデータ構造である InferenceData を提供 • Python, Julia から利用可能
• TFP, PyMC, Pyro, PyStan 対応 pip install arviz https://arviz-devs.github.io/arviz/

ざっくりとした雰囲気 ArviZ 粒度小粒度大 • TF Probability • Pyro /
NumPyro • Stan • PyMC

実行時間ベンチマーク 1 (by Turing.jl team) Slowest Fastest Dirichlet Process Gaussian
mixture model の推論速度を検証 4 Intel(R) Xeon(R) Platinum 8124M CPU @ 3.00GHz 引用： https://luiarthur.github.io/TuringBnpBenchmarks/

実行時間ベンチマーク 2 (by Turing.jl team) Slowest Fastest Gaussian Process regression
model の推論速度を検証（ c5.xlarge AWS instance. ）引用： https://luiarthur.github.io/TuringBnpBenchmarks/

実行時間ベンチマーク 3 (by Turing.jl team) Slowest Fastest Gaussian Process classifier
model の推論速度を検証（ c5.xlarge AWS instance. ）引用： https://luiarthur.github.io/TuringBnpBenchmarks/

新しい PPL も十分に実用的速度 • 基本的に Stan は速い • Compile 時間を含めると
New PPLs は速いモデル自体を何度も弄るなら PPLs は十分な選択肢

各 PPL のコードを比較性能は分かった。使いやすさはどうか。単回帰を MCMC で推論するコードを比較（本来 MCMC を持ち出すモデルではないが…）
それぞれの書き方、 API の雰囲気を見る

Stan で単回帰 1. モデル作成　（ Stan ファイルフォーマットに従う）２． MCMC サンプル取得
Stan (C++) を Python や R から叩く Stan にやらせたいことは Stan ファイルに書ききる

TFP で MCMC ：単回帰モデル分散既知 1. モデル作成（同時分布の定義） 2. 同時確率関数作成 3. 確率遷移核の作成
4. MCMC サンプラ関数呼び出しサンプラ周りのコードが少し重い推論対象のパラメタもユーザが管理

TFP で MCMC ：単回帰モデル分散未知 1. モデル作成（同時分布の定義） 2. 同時確率関数作成 3. 確率遷移核の作成
4. MCMC サンプラ関数呼び出しサンプラ周りのコードがだいぶ重い推論対象のパラメタもユーザが管理

PyMC4 で MCMC : 単回帰 ( 分散未知 ) PyMC4 モデルを推論関数に渡すだけ（パラメタ管理等を任せられる）
別途モデルを解釈できる関数で予測モデルなどを構築可能１．モデルを書く 2 ． sample 関数に渡す

Pyro で MCMC : 単回帰（分散未知） Pyro / NumPyro モデルを推論クラスに渡す（パラメタ管理等を任せられる）別途モデルを解釈できる関数・クラスで予測モデルなどを構築可能
１．モデルを書く 3 ． MCMC 関数に渡して run()! 2 ．確率遷移核インスタンス作成

書きやすさに関する所感 • TensorFlow Probability は一段低いとこから書く細かいことを書ける / 書かなければいけない • 個人的には
Pyro のインターフェースが気に入っている • PyMC4 は完成すれば第一候補（ PyMC4 で弄れない時に仕方なく TFP を使う感じ）

現在の状況・ TFP 　基本的には研究用 + バックエンドの立ち回り ? 　 (Stan3, PyMC4,
Edward2 等 TFP を基礎に置く PPL, TFP for Jax, for numpy 開発中 ) 　 tf.Variable を tf.Module で管理 , tf.keras.Model で管理が両方いる　 tfp.layers, tfp.sts, tfp.glm, tfp.vi 等の高レベルモジュールあり・ Pyro / NumPyro 　本体は必要最小限の機能を提供（ MiniPyro でコアが分かる）　　 contrib に特定用途用の高レベルモジュールが点在　 Pyro は特に変分推論と NN の組み合わせが非常に柔軟・ PyMC4 　 Mixture や TimeSeries 等の整備はこれから、本格利用はまだ早い

Pyro で GMM を一通り • TFP の使い方、例は他の発表で見られる • PPL 比較のために
Pyro の例を出していく

クラスタリングの例３つの異なる多変量正規分布からランダムにデータを取得色分け：各クラスタを表現データのクラスタ割当は知らない設定

同時分布の記述 p μ ∑ X Z K N 事前分布からのサンプリング

事後分布の推論・推論はたった３行・推論するパラメタは自動判定・離散パラメタは自動で周辺化・ summary() メソッドで結果確認 p μ ∑
X Z K N

事後分布の可視化 arviz フォーマット対応可視化が楽！！（ TFP も PyMC4 も PyStan
も対応）

推論済のパラメタで生成モデル p μ ∑ X Z K N 1. 事後分布（
mcmc サンプル）から各パラメタの平均を計算 2. 元のモデルから条件付き確率モデル作成 3. 条件付き確率モデルからサンプル生成

パラメタとデータで潜在変数推論 p μ ∑ X Z K N 設計した同時分布から潜在変数以外の条件付き分布を求め MAP
推定

変分推論モジュールも充実・変分分布の設定を自動で行ってくれる機能あり・マニュアルで作成することも可能・ Flow 系各種も取り揃えられている・パラメタの事前分布を把握し、自動で再パラメタ化

最後に • Deep Learning がライブラリの整備で隆盛した • Julia Lang でも Turing.jl
や Gen.jl 等が開発中 • 今後 PPL の整備で確率モデリングの人口増加、有用性認知 • TFP と PyMC4 は確率モデリングをブーストするはず • 今は個人的に Pyro が使いやすいが、今後の整備に注目

参考 DynamicPPL: Stan-like Speed for Dynamic Probabilistic Model https://arxiv.org/abs/2002.02702 Turing.jl
チームメンバによる PPL の比較 https://luiarthur.github.io/TuringBnpBenchmarks/dpsbgmm ArviZ https://arviz-devs.github.io/arviz/ TensorFlow Probability https://www.tensorflow.org/probability?hl=ja

TFUG_PPL_compare_HELLOCYBER.pdf

TFUG_PPL_compare_HELLOCYBER.pdf

hellocyber

Featured

Transcript

TFUG: ベイズ分科会 2020/9/6 ブログ : HELLO CYBERNETICS Twitter : ML_deep

自己紹介 • 学生時代： Brain Computer Interface の分野 – 制御や最適化に興味があった（応用対象は問わず） –

目次 • PPL の役割と意義 • PPL 速度比較 • モデリング、推論 API

なぜ PPL を利用するのか ▪ データ分析の大まかな流れ – 仮説を構築 – データ収集 –

なぜ PPL を利用するのか ▪ データ分析の大まかな流れ – 仮説を構築 – データ収集 –

モデリングと推論実行の概要 X Y W X Y W μ ∑ σ

モデリングと推論実行の概要 X Y W X Y W μ ∑ σ

様々な PPL • Wikipedia 　 https://en.wikipedia.org/wiki/Probabilistic_programming　参照 , 一部抜粋近年は深層学習ライブラリベースの GPU

可視化ライブラリ ArviZ • 共通のデータ構造である InferenceData を提供 • Python, Julia から利用可能

ざっくりとした雰囲気 ArviZ 粒度小粒度大 • TF Probability • Pyro /

実行時間ベンチマーク 1 (by Turing.jl team) Slowest Fastest Dirichlet Process Gaussian

実行時間ベンチマーク 2 (by Turing.jl team) Slowest Fastest Gaussian Process regression

実行時間ベンチマーク 3 (by Turing.jl team) Slowest Fastest Gaussian Process classifier

新しい PPL も十分に実用的速度 • 基本的に Stan は速い • Compile 時間を含めると

各 PPL のコードを比較性能は分かった。使いやすさはどうか。単回帰を MCMC で推論するコードを比較（本来 MCMC を持ち出すモデルではないが…）

モデリングと推論実行の概要 X Y W X Y W μ ∑ σ

Stan で単回帰 1. モデル作成　（ Stan ファイルフォーマットに従う）２． MCMC サンプル取得

TFP で MCMC ：単回帰モデル分散既知 1. モデル作成（同時分布の定義） 2. 同時確率関数作成 3. 確率遷移核の作成

TFP で MCMC ：単回帰モデル分散未知 1. モデル作成（同時分布の定義） 2. 同時確率関数作成 3. 確率遷移核の作成

PyMC4 で MCMC : 単回帰 ( 分散未知 ) PyMC4 モデルを推論関数に渡すだけ（パラメタ管理等を任せられる）

Pyro で MCMC : 単回帰（分散未知） Pyro / NumPyro モデルを推論クラスに渡す（パラメタ管理等を任せられる）別途モデルを解釈できる関数・クラスで予測モデルなどを構築可能

書きやすさに関する所感 • TensorFlow Probability は一段低いとこから書く細かいことを書ける / 書かなければいけない • 個人的には

現在の状況・ TFP 　基本的には研究用 + バックエンドの立ち回り ? 　 (Stan3, PyMC4,

Pyro で GMM を一通り • TFP の使い方、例は他の発表で見られる • PPL 比較のために

クラスタリングの例３つの異なる多変量正規分布からランダムにデータを取得色分け：各クラスタを表現データのクラスタ割当は知らない設定

同時分布の記述 p μ ∑ X Z K N 事前分布からのサンプリング

事後分布の推論・推論はたった３行・推論するパラメタは自動判定・離散パラメタは自動で周辺化・ summary() メソッドで結果確認 p μ ∑

事後分布の可視化 arviz フォーマット対応可視化が楽！！（ TFP も PyMC4 も PyStan

推論済のパラメタで生成モデル p μ ∑ X Z K N 1. 事後分布（

パラメタとデータで潜在変数推論 p μ ∑ X Z K N 設計した同時分布から潜在変数以外の条件付き分布を求め MAP

変分推論モジュールも充実・変分分布の設定を自動で行ってくれる機能あり・マニュアルで作成することも可能・ Flow 系各種も取り揃えられている・パラメタの事前分布を把握し、自動で再パラメタ化

最後に • Deep Learning がライブラリの整備で隆盛した • Julia Lang でも Turing.jl

参考 DynamicPPL: Stan-like Speed for Dynamic Probabilistic Model https://arxiv.org/abs/2002.02702 Turing.jl