Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文サーベイ NVIDIA SIMNET™: AN AI-ACCELERATED MULTI...
Search
Takanori Kotama
June 17, 2025
Research
0
4
論文サーベイ NVIDIA SIMNET™: AN AI-ACCELERATED MULTI-PHYSICS SIMULATION FRAMEWORK
NVIDIA SIMNETの論文
https://arxiv.org/pdf/2012.07938のサーベイ
Takanori Kotama
June 17, 2025
Tweet
Share
More Decks by Takanori Kotama
See All by Takanori Kotama
最近話題の1bit量子化とは?実際に調べてみました!
kotama7
0
130
新たなAIアーキテクチャ を作ろう!! ~フーリエ級数展開編~
kotama7
0
150
Other Decks in Research
See All in Research
IMC の細かすぎる話 2025
smly
2
650
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
59
29k
SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images
satai
3
240
Learning to (Learn at Test Time): RNNs with Expressive Hidden States
kurita
0
190
国際論文を出そう!ICRA / IROS / RA-L への論文投稿の心構えとノウハウ / RSJ2025 Luncheon Seminar
koide3
8
5.2k
Submeter-level land cover mapping of Japan
satai
3
340
SSII2025 [SS2] 横浜DeNAベイスターズの躍進を支えたAIプロダクト
ssii
PRO
7
4k
時系列データに対する解釈可能な 決定木クラスタリング
mickey_kubo
2
980
Pythonでジオを使い倒そう! 〜それとFOSS4G Hiroshima 2026のご紹介を少し〜
wata909
0
460
ロボット学習における大規模検索技術の展開と応用
denkiwakame
1
120
SSII2025 [TS1] 光学・物理原理に基づく深層画像生成
ssii
PRO
4
4.3k
MIRU2025 チュートリアル講演「ロボット基盤モデルの最前線」
haraduka
15
8.3k
Featured
See All Featured
Done Done
chrislema
185
16k
KATA
mclloyd
32
14k
The Invisible Side of Design
smashingmag
301
51k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Practical Orchestrator
shlominoach
190
11k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.6k
GitHub's CSS Performance
jonrohan
1032
460k
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.7k
Building Applications with DynamoDB
mza
96
6.6k
Producing Creativity
orderedlist
PRO
347
40k
Transcript
論文サーベイ NVIDIA SIMNET : AN AI-ACCELERATED MULTI-PHYSICS SIMULATION FRAMEWORK 樹神宇徳
導入 • シミュレーションは現在様々な分野で応用されているが、複雑なシ ミュレーションになればなるほど計算量的に高価になってしまう。 これはシミュレーションを繰り返す上でボトルネックとなる。 • 深層学習によるシミュレーションの代替はこのボトルネックを解消 するポテンシャルを持っているが、依然として以下のような問題を 抱えている •
教師有り学習を行う場合、教師データ作成には計算量的に高価なシミュレー ションを行う必要がある。 • 出力された結果は支配方程式を満たすとは限らず、信頼できない結果を出力 する可能性がある。
導入 • 前述のような問題点を解決するためにニューラルネットワーク ソルバが開発された。 • これは損失関数を教師データとの差ではなく、支配方程式(多くの場合 偏微分方程式)との差にしたものである。 • 損失関数に出現する偏微分項は自動微分によって求めることが出来る。 •
支配方程式から損失関数を計算するため教師データが必要なく、高価 な計算をしなくても良い。
補足1:自動微分 • ニューラルネットワークの誤差逆伝搬では再帰的に連鎖律を用 いて微分を行っている • ニューラルネットワークを計算グラフとして出力を保存することに よって入力変数の微分を求めることが出来る • 二回微分を求めたい場合は一回微分の計算グラフを構築してもう一度 再帰的に微分することによって求めることが出来る
導入 • しかし依然としてニューラルネットワークソルバは1次元また は2次元のシミュレーションでの利用にとどまっている。 • 次元が増える毎に支配方程式の複雑性が増大する。 • そこで3次元シミュレーションにも適用可能なニューラルネットワーク ソルバであるSimNetを本論文で提案する。 •
本論文ではFPGAのヒートシンクのシミュレーションで有効性を検証す る。
ニューラルネットワークソルバ • ニューラルネットワークソルバ以下のような構造を持つ
ニューラルネットワークソルバ • 求めたいシミュレーションの偏微分方程式を以下のように定義 する。 • 𝒩𝑖 は求めたいi番目の偏微分方程式の微分作用素。u(x)は偏微分方程式 の解。𝒟は独立変数の有界連続領域。 • 𝒞𝑗
はj番目の境界条件や初期条件を表すための制約演算子。∂𝒟は制約条 件を表すための領域境界の集合
ニューラルネットワークソルバ • 次に偏微分方程式の解u(x)をニューラルネットワークで近似し た𝑢𝑛𝑒𝑡 (𝑥; 𝜃)を以下のように定義する。 • 𝜙𝑖 はi番目のニューラルネットワーク。𝑊𝑖 はi番目の重み行列。
𝜎は活性化関数。𝑏𝑖 はi番目のバイアス項 • これにより偏微分方程式、制約条件の理論解と近似解の残差は 以下のようにあらわせる。
ニューラルネットワークソルバ • 偏微分方程式、制約条件の残差から損失関数を以下のように定 義する。 • ||はp次元のノルムである。𝜆 𝒩 (𝑖)はi番目の偏微分方程式の重み関数であ る。 𝜆
𝒞 (𝑖)はj番目の制約条件の重み関数である。
SimNetの概略 • SimNetのアーキテクチャの概略は以下の通り • CSG ModuleとTG Moduleは立体データを構築するためのモジュールである。 • PDE Moduleはよく使用される偏微分方程式が実装されているモジュールである。
SimNetの概略 • SimNetの重み付け関数𝜆は下記に示す符号付き距離関数(SDF) を使用する。 • 入力領域𝐷の部分集合𝐷𝑥 とその領域境界𝜕𝐷𝑥 ⊆ 𝜕𝐷を用いてSDFは下記 の式に表される。
• 関数𝑑(𝑥𝑠 , 𝜕𝐷𝑥 )は𝑥𝑠 と𝐷𝑥 上の最近傍点とのユークリッド距離を返す関数 である。 • 本実験では𝐷𝑥 = 𝐷かつ𝜕𝐷𝑥 =𝜕𝐷とする。 • SDFを導入することで極端に高い勾配を持つ急カーブ領域の影響を緩 和し、収束性と予測精度を向上させる
偏微分方程式モジュール • 本論文では乱流シミュレーションの偏微分方程式としてナビエ –ストークス方程式を用いた以下の0方程式乱流方程式を採用す る。
補足2:ナビエ–ストークス方程式 • 流体の運動を記述する2階非線型偏微分方程式であり、速度場v と圧力pは以下を満たす。 • v,pの一般解の存在性は「ナビエ–ストークス方程式の解の存在と滑ら かさ」というミレニアム懸賞問題の一つであり未解決。
補足3: 0方程式乱流方程式 • 流れの状態によって決まる物理量である渦粘性係数𝜇𝑡 は流れの 状態によって決まる物理量で決め方には任意性があり、決定的 な方法は発見されていない。 • 付加的な物理量を考えることなく、 𝜇𝑡
を決定する乱流モデルを 0方程 式モデルと呼ぶ。 • 仮説を立て𝜇𝑡 を判明している物理量から計算し近似する方法。
ネットワークアーキテクチャ • SimNetにはさまざまなネットワークアーキテクチャがデフォ ルトで用意されているが、本論文では以下の三つのアーキテク チャで実験を行う。 • フーリエ特徴量ネットワーク(Fourier feature networks) •
改変型フーリエ特徴量ネットワーク(Modified Fourier feature networks) • Sin型表現ネットワーク(Sinusoidal Representation Networks: SiReNs)
フーリエ特徴量ネットワーク • ニューラルネットワークでは低周波成分の学習が高周波成分の 学習より優先されるというバイアスが存在する(スペクトルバイ アス)。 • そこで三角関数を用いて以下の訓練可能なエンコード層を追加する事 で疑似的なフーリエ変換を行うことによりこのバイアスを解消する。 • 𝑓
∈ ℝ𝑛𝑓×𝑑0は訓練可能な重み行列であり、𝑛𝑓 はノード数、𝑑0 は𝑥の次元 数を表す。
改変型フーリエ特徴量ネットワーク • フーリエ特徴量ネットワークを改良して学習されたフーリエ変 換を各層に2つの写像を用いて導入する手法 • 𝑊𝑇1 , 𝑊𝑇2 , 𝑏𝑇1
, 𝑏𝑇2 は学習可能なパラメータ。 • ある周波数要素の𝑇1 , 𝑇2 要素の写像をどの割合で足し合わせるかを学習 している
補足4:アダマール積 • 同じサイズの行列に対して成分ごとに積を取ることによって定 まる行列の積をアダマール積と呼ぶ。
Sin型表現ネットワーク • 全ての層でsinを活性化関数とすることで前述のモデル達と同様 にフーリエ変換を擬似的に再現 • 全ての重みを一様分布𝑊𝑖 ∼ 𝑈(− 1 𝑑𝑖−1
, 1 𝑑𝑖−1 )で初期化する。 • これによりsin関数への入力は正規分布に従い、sin関数の出力はarcsin に従うようになる。 • このような制限されたアーキテクチャがモデルの収束を早めることが 出来る。
ネットワークアーキテクチャ • 前述の3モデルは6層からなり、各層512個のノードを持ち、 Swish関数を活性化関数に持つ。 • オプティマイザはAdamとし、初期学習率は10−4とし、指数関 数学習率減衰を持つ。 • 損失関数には符号付き距離関数を実装する。
FPGAシミュレーション • FPGAの空気流及び温度をSimNetを用いてシミュレーションを 行う • 以下の画像に示される構造のFPGAにおいて本実験を行う • (a)はヒートシンク、(b)はシミュレーション領域、青の断面は左右対 称面を示す
FPGAシミュレーション • 本実験では、計算量の削減のために左右対称面の片方のみで計 算したフーリエ特徴量ネットワークとSDFの有効性を確認する ためにSDFなしのフーリエ特徴量ネットワーク、ベースライン として単純な多層ニューラルネットワークでも実験を行った • 以下の画像は各モデルの損失関数の収束を表している
FPGAシミュレーション • 次にFPGAヒートシンクの最適化に重要な圧力降下と最高温度 の予測結果を以下に示す。 • 最高温度は商用ソルバに近い予測をしており、圧力降下についても高 い精度を発揮している
頭蓋動脈の動脈瘤の血流予測 • SimNetの汎用性を示すために頭蓋動脈の動脈瘤の血流シミュ レーションを同条件で行ってみた。 • 結果血流はかなり高い精度で予測することができ、血圧もOpenFOAM ソルバと近い予測をすることができた。
設計最適化問題 • 従来のメッシュを用いてシミュレーションを行うソルバに比べ て複数の設計パラメータを一度の学習で訓練することができる ため設計最適化に向いている。 • 以下に本実験で最適化するNVSwitchの基本構造とその設計パラメータ を示す
設計最適化問題 • 設計最適化において重要な圧力降下と最高温度の予測結果を以 下に示す。 • 商用ソルバに対してOpenFOAMは4.5%の過大に、SimNetは15%過小 に予測した。 • SimNetは商用ソルバに対して4500倍、OpenFOAMに対しては135000 倍速く最適化を行うことが出来た。
逆問題 • 科学や工学では偏微分方程式を解くための不明なシステム変数 を推論しなければいけない場合がある。 • 推論したい変数を訓練可能な変数としてSimNetに組み込むことで不明 なシステム変数の値を推論することが出来る。 • 以下に2次元のヒートシンクデータから熱拡散係数と粘度を推論した結 果を示す
結論 • SimNetは偏微分方程式のみから訓練データを使用せずナビエ– ストークス方程式に支配された物理現象シミュレーションをよ い精度かつ高速に収束させた。 • SDFは急カーブ領域を持つ構造や偏微分方程式において損失関 数を高速に収束し良い精度を出すことに寄与した。 • 本実験で取り扱った内容だけでなくSimNetは様々な偏微分方
程式と境界条件をもつシミュレーションにおいて有用であり、 商用ソルバと良い相関を持つ。 • SimNetはオープンソースとして公開されており誰でも利用す ることが出来る
参考文献 • NVIDIA SIMNET : AN AI-ACCELERATED MULTI-PHYSICS SIMULATION FRAMEWORK:https://arxiv.org/pdf/2012.07938