Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Compact 3D Scene Representation via Self-Organi...

Compact 3D Scene Representation via Self-Organizing Gaussian Grids

- 学習と同時にGaussian Splatting表現の圧縮を行う手法
- Gaussianパラメータを2次元グリッド上に配置し、最適な配置を求めた上で、画像圧縮技術を用いてファイルサイズを縮小
- 通常のGaussian Splattingと同程度なレンダリング品質を維持しつつ、ファイルサイズを数十分の1まで削減可能

Spatial AI Network

October 23, 2024
Tweet

More Decks by Spatial AI Network

Other Decks in Technology

Transcript

  1. 7 3DGSを同じ考え方で圧縮したい 本日紹介する論文: Self-organizing Gaussian Grids [Morgenstern+, ECCV 2024] -

    問題設定はオリジナル 3DGSと同 じ(=複数視点画像から 3DGSを 最適化) - 3DGS自体の表現も変化なし(中 心点の位置、共分散、透明度、方 向依存の色) - データのフォーマットとしては圧縮 画像を用いる(上記のパラメータ をJPEGで保存) - ※圧縮は3DGSの学習と同時に 行う必要があり、学習済み 3DGS をpost-processingで圧縮する手 法ではない
  2. 10 Self-organizing Map (SOM) [Kohonen+ 1988] 2次元グリッドのソート X*Y=N個のデータをグリッド上に配置 - グリッドのデータをランダムに初期

    化 - N個のデータから1つ選び、グリッド で最も近いデータの場所を計算し、 そこにデータを配置 - 近傍のグリッドに対して、距離に応 じて、データの特徴量に近づけるよ うに更新を行う - 上記ステップ2−3を繰り返して全て のデータをグリッド上に配置
  3. 11 Linear Assignment Sorting (LAS) 2次元グリッドのソート SOMとの違い - 最初にデータをグリッド上にランダムに配置する -

    Blur処理後、最適な配置を最大マッチング問題として 求め、データの位置交換を行う - Blurの半径を小さくして上記ステップを繰り返す Fast Linear Assignment Sorting (FLAS) LASとの違い - データのサブセットをランダムに選び、サブセット内で 最適な配置を求め、位置交換を行う [Barthel+, 2023]
  4. 13 - タイミング:学習の最初のステップとGS densificationの後 - グリッドの解像度:L^2 < len(Gaussians)を満たす最大のL - GS

    densificationの後でGaussianの数が変わるため、都度ソートが必要 - 高次元Gaussianの「近さ」を測る距離メトリック - 各物理量を[0, 1]の範囲に正規化し、無次元量として扱う 2次元グリッドのソート
  5. 17 新規視点のレンダリング品質は同等でありながら、ファイルサイズはオリジナル 3DGSの17x~42x小さい - SHあり・なしの設定どちらにも効果あり オリジナルGSに比べてGaussianの数が大幅に減っている(=少ないGaussianで 元のシーンを表現可能) - Truckシーン:オリジナルは2.58M, 本手法は1.55M

    - Gaussianの数が少なくなったことで学習速度が上がり、ソート計算のオーバー ヘッドはあるものの、全体の学習時間はオリジナルGSと変わらない - 推論時のレンダリング速度も向上(オリジナルの385fpsに対して、本手法では 515fps) 実験結果
  6. 20 - 3DGSには2種類の「冗長性」が存在 - 元のシーンのGaussianの冗長性(=不必要・不正確なGaussianが多数存在) - 順序に依存しない高次元データの冗長性(=効率的な圧縮方法があるはず) - 1つ目の冗長性も実はかなり重要? -

    SplatField [Mihajlovic+, ECCV 2024] も似たような主張(i.e., オリジナル3DGSは近隣 空間の相関性情報を上手く利用できていない) - ソートを毎回やり直すのは少々無駄かもしれない - 最終のソート以外では、smoothness正則化の方が重要であると言えるかもしれない - 圧縮は学習と同時に行われるため、既存の3DGSファイル(.ply)には直接適用できない - GSのplyを受け取って圧縮できるような手法だとより使いやすい - もしくは新たなGSの標準フォーマットが今後できるかもしれない 感想