3D Gaussian Splatting for Real-Time Radiance Field Rendering

3D Gaussian Splatting for Real-Time Radiance Field Rendering 2024/3/6 飯田啄巳

概要タイトル：3D Gaussian Splatting for Real-Time Radiance Field Rendering
著者：Bernhard Kerbl, Georgios Kopanas, Thomas Leimkühler, George Drettakis 所属：Inria, Université Côte d'Azur, MPI Informatik 学会：SIGGRAPH 2023 特徴： • 高速な学習 • 高速な描画（>=30fps） • 高解像度（1080p）

わかりやすい記事でまず紹介初期状態：SfMで得られたスパースな点群点群を増やしたり減らしたりする 3D Gaussian 3D Gaussians 一つ一つ違う • 位置
• 形状（共分散行列） • 色 • 透明度（α）透明度αを0とした場合 3D Gaussian（今回） Triangle（通常）プリミティブを3D Gaussianにしてシーンを構成 https://huggingface.co/blog/gaussian-splatting より引用

処理フロー 1. SfMの点群を初期値として開始 2. 3Dガウシアンをカメラ座標系に投影 3. 投影したガウシアンをラスタライズ 4. 描画画像とGTとで損失計算 5.
ガウシアンの密度制御繰り返す

ガウシアンの密度制御こういうやつを使うランダム値でもそこそこ良いらしい 3Dガウシアンの形状表現形式 × 𝛼 三次元共分散行列（これがガウシアンの形状を決める）他に以下の情報を持つ • 位置 • 透明度（𝛼） • 球面調和係数（色） 3Dガウシアンは異方性をもつオブジェクトも表現可能

処理フロー 1. SfMの点群を初期値として開始 2. 3Dガウシアンを2Dに投影 3. 投影したガウシアンをラスタライズ 4. 描画画像とGTとで損失計算 5.
ガウシアンの密度制御世界座標系での 3D共分散カメラ座標系での 2D共分散視点変換行列透視投影変換のアフィン近似のヤコビアン Zwicker[2001a]によるとこういう変換形式になる projection 共分散行列は半正定値でないと物理的な意味を持たない＝最適化しにくい → 楕円体として表せば良いのでは？最適化の対象なんだけど… スケール行列＆回転行列

処理フロー 1. SfMの点群を初期値として開始 2. 3Dガウシアンを2Dに投影 3. 投影したガウシアンをラスタライズ 4. 描画画像とGTとで損失計算 5.
ガウシアンの密度制御 rasterize ポリゴン（ガウシアン）で深度ソート（Radix Sort）カスタムCUDAカーネルを作ったり、 GPUアクセラレートフレームワークを使ったり自動微分はせず、予め微分の式を作っておいたり… タイルベースのラスタライズ … 16x16 ビュー台形との信頼区間が99%のガウシアンだけ残す（意味わかってない） 16x16 16x16 16x16 16x16 … タイルごとにスレッドを立ち上げてラスタライズ

ガウシアンの密度制御

ガウシアンの密度制御 100イテレーションごとに緻密化、𝛼 < 𝜖𝛼 （透明）の場合ガウシアンを破棄小さいガウシアンはクローン大きいガウシアンは分割

ガウシアンの密度制御繰り返す • NNは使ってない • 自動微分はやらない • 全部のガウシアンが勾配を受け取る＝制限なし＝シーン依存のハイパラ不要手計算してます

結果：実データ Mip-NeRF360 ：高品質だけど、時間かかる Plenoxels, InstantNGP ：速いけど低品質 3D Gaussian Splatting ：高品質かつ速い
7Kイテレーションでもそこそこ良い＝収束速い

Ablation Study：初期値の重要性合成データ（Blender）だといい加減な初期値（ランダム）でも良い結果ランダムな初期値でも全体的には良い結果しかし、背景部分にモヤ(floaters)が出現

Ablation Study：ガウシアンの分割やクローンをやらない場合などの違い大きなガウシアンを分割しないと背景がだめになる（細かい部分に適応できない？）小さなガウシアンをクローンしないと収束が弱くなる

Ablation Study：3Dガウシアンが異方性を持つ必要性割りと露骨に球体が現れる

Ablation Study：諸々の効果 • 球面調和関数（Spherical Harmonics, SH）視点依存の効果を付与できる

Limitations（というより性質に近い） • 観測シーンが少ない場合はアーチファクトが発生 • 大きなガウシアンが作られた場合にポッピングが発生（LODの切り替えタイミングで起きるアーチファクト） • 視点位置のアピアランスの影響？ • ラスタライザのガードバンドで棄却される？（説明省きました） •
細長いアーチファクトやポツポツとしたアーチファクトになりがち

思ったことメタボールっぽい Fuzzy Metaballsというのが1年前にあった https://kanamori.cs.tsukuba.ac.jp/jikken/inner/metaball.pdf

補足

Plenoxels https://alexyu.net/plenoxels/

Fuzzy Metaballs https://leonidk.com/fuzzy-metaballs/

3D Gaussian Splatting for Real-Time Radiance Fi...

3D Gaussian Splatting for Real-Time Radiance Field Rendering

frkake

More Decks by frkake

Other Decks in Research

Featured

Transcript