Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
第61回 コンピュータビジョン勉強会「Mip-Splatting: Alias-free 3...
Search
hiroki kawauchi
August 03, 2024
Technology
1
200
第61回 コンピュータビジョン勉強会「Mip-Splatting: Alias-free 3D Gaussian Splatting」
hiroki kawauchi
August 03, 2024
Tweet
Share
More Decks by hiroki kawauchi
See All by hiroki kawauchi
20230827_PLATEAU_Hackathon_G
kwchrk
0
500
Other Decks in Technology
See All in Technology
Oracle Autonomous Database:サービス概要のご紹介
oracle4engineer
PRO
1
7.1k
可視化により内部品質をあげるAIドキュメントリバース/20240910 Hiromitsu Akiba
shift_evolve
0
230
テスト”ケース”駆動開発 で手戻りをなくそう
ryohma0510
0
340
watsonx.ai Dojo 環境準備について
oniak3ibm
PRO
0
360
再考 アクターモデル/ reconsider actor model
ytake
0
380
20240911_New_Relicダッシュボード活用例
speakerdeckfk
0
110
Jetpack Compose Modifier 徹底解説 / Jetpack Compose Modifier
wiroha
0
210
『GRANBLUE FANTASY: Relink』専任エンジニアチームで回す大規模開発QAサイクル
cygames
0
110
不動産 x AIことはじめ~データの真価を拓くために
estie
0
130
Cloud Run と GitHub Template Repository による軽量なアプリケーションプラットフォーム/ #nikkei_tech_talk
nikkei_engineer_recruiting
0
120
「認証認可」という体験をデザインする ~Nekko Cloud認証認可基盤計画
logica0419
2
460
どこよりも遅めなWinActor Ver.7.5.0 新機能紹介
tamai_63
0
210
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
26
3.9k
10 Git Anti Patterns You Should be Aware of
lemiorhan
653
58k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.3k
Typedesign – Prime Four
hannesfritz
39
2.3k
Imperfection Machines: The Place of Print at Facebook
scottboms
263
13k
Thoughts on Productivity
jonyablonski
66
4.2k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
43
2k
Fireside Chat
paigeccino
31
2.9k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
158
15k
What's in a price? How to price your products and services
michaelherold
242
11k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.2k
Docker and Python
trallard
39
3k
Transcript
Mip-Splatting: Alias-free 3D Gaussian Splatting 2024.08.03 hiroki kawauchi 第61回 コンピュータビジョン勉強会@関東(後編)
自己紹介 hiroki kawauchi • メガベンチャーでMLエンジニア • 業務:CV/LLM • 学生時代: ◦
衛星画像など地理情報解析 ▪ Kawauchi, H., et al. (2022). Shap-based interpretable object detection method for satellite imagery. Remote Sensing, 14(9), 1970. ◦ 3D再構成
Contents 1. 3D Gaussian Splatting Tutorialと CVPR2024でのトレンド 2. 論文サマリ 3.
課題と関連研究 4. 提案手法と実験結果 5. まとめ
1. 3D Gaussian Splatting Tutorialと CVPR2024でのトレンド 2. 論文サマリ 3. 課題と関連研究
4. 提案手法と実験結果 5. まとめ 1. 3D Gaussian Splatting Tutorialと CVPR2024でのトレンド
3D Gaussian Splatting Tutorial • Kerbl, B., et al. (2023).
3d gaussian splatting for real-time radiance field rendering. ACM Transactions on Graphics, 42(4), 1-14. ◦ INRIA(仏)の研究者らが、 SIGGRAPH2023にて提案。 ◦ 1年でcitation 1000 over。
3D Gaussian Splatting Tutorial • 自由視点画像合成の手法。従来手法=NeRFを、品質・学習時間・レンダリング速度で 上回り、高品質なリアルタイムレンダリングを可能にした。
3D Gaussian Splatting Tutorial • 3DのGaussians(位置・大きさ・色・透明度)をsplat(ばらまく) • 3D→2D平面に投影して、ラスタライズレンダリングによって描画=高速・軽量 ◦ NeRFと異なる点
▪ NNは用いない。NeRFは光線ごとに追うレイトレーシング(マーチング)
3D Gaussian Splatting in CVPR2024 CVPR2024でも多数の3DGS系論文が採択。 • 高品質化:Mip-Splatting [Best Student
Paper] • 動的シーンへの対応:Spacetime Gaussian Feature Splatting • 3DGS+(surface)再構成 ◦ SuGaR (Surface-Aligned Gaussian Splatting) ◦ Gaussian Splatting SLAM [Oral] • セマンティクスの付与:LangSplat [Highlight] • Human Modelling:GPS-Gaussian [Highlight] その他、SIGGRAPH2024でも多数採択。
1. 3D Gaussian Splatting Tutorialと CVPR2024でのトレンド 2. 論文サマリ 3. 課題と関連研究
4. 提案手法と実験結果 5. まとめ 2. 論文サマリ
論文サマリ: Mip-Splatting: Alias-free 3D Gaussian Splatting Project Page: https://niujinshuchong.github.io/mip-splatting Code:
https://github.com/autonomousvision/mip-splatting Paper: https://arxiv.org/pdf/2311.16493.pdf Viewer: https://niujinshuchong.github.io/mip-splatting-demo/ 概要 • 3DGSのZoom In/Outで発生する エイリアスを抑制した手法を提案。 • 3D Smoothing Filterで、3D空間での 最大周波数を制限。 • 2D Mip Filterで、2D画像空間での 膨張ノイズを軽減。 • Best Student Paper
1. 3D Gaussian Splatting Tutorialと CVPR2024でのトレンド 2. 論文サマリ 3. 課題と関連研究
4. 提案手法と実験結果 5. まとめ 3. 課題と関連研究
3D Gaussian Splattingの課題 ズームアウト時の膨張ノイズ • ズームアウト(or 焦点距離小)時 膨張して投影されてしまう問題。 • 2D
Dilation Filterによって、本来は 小さなGaussianが強調される。 • 3DGSには、Gaussianの周波数制約 なし。
3D Gaussian Splattingの課題 ズームイン時の高周波ノイズ • ズームイン(or 焦点距離大)時に 高周波ノイズが発生する問題。 • 特に詳細性が高いシーンやエッジに
高周波成分が含まれがち。 • 3DGSでは、2D画像平面に投影する際 エッジを強調するために2D Dilation Filterが使用されるため発生。
関連研究:Elliptical Weighted Average (EWA) Splatting • ZWICKER, Matthias, et al.
EWA volume splatting. In: Proceedings Visualization, 2001. VIS'01. IEEE, 2001. • EWA Splattingでは画像のナイキスト周波数に基 づく、周波数制約を課す ◦ 画像平面上の2D Gaussianにlow pass filter ▪ Prefilteringと呼ばれるanti-aliasing手法 ▪ Filter sizeは経験的に選択する
関連研究:Mip-NeRF • BARRON, Jonathan T., et al. Mip-nerf: A multiscale
representation for anti-aliasing neural radiance fields. ICCV, 2021. • 高周波ノイズを減衰させるためにIntegrated position encoding (IPE)を導入 ◦ 特徴量を視線上の点ではなく、ガウス分布で近似したコーン内積分で表現 • CGにおけるアンチエイリアス手法のmipmapから命名
1. 3D Gaussian Splatting Tutorialと CVPR2024でのトレンド 2. 論文サマリ 3. 課題と関連研究
4. 提案手法と実験結果 5. まとめ 4. 提案手法と実験結果
提案手法:3D Smoothing Filter • 目的:ズームイン時の高周波ノイズを排除する • 3D表現の最大周波数制約ををtrain画像から決定 • 標本化定理より、標本周波数の1/2を超える成分を除去するlow pass
filterを適用する • n個選んだカメラの少なくとも1台が再構成できる最大の周波数を制約にする カメラnから見えるか? Gaussianの中心p 焦点距離f 距離d 各Gaussian primitives Gaussian low pass filter
提案手法:2D Mip Filter • 目的:3DGSの2D dilation filterのエッジ強調によるノイズを緩和する • 画像平面で2D box
filterを適用したい ◦ 効率化のため2D Gaussian filterで近似する p: Gaussianの中心 s: filter size
実験結果 実装詳細 • データセット:Blender Dataset、Mip-NeRF360データセット • 学習: ◦ 各シーン30,000 iterで、100iterごとに標本周波数を計算
▪ その分若干オーバーヘッドは増える • 手法: ◦ 3DGS、3DGS +EWA等と比較
実験結果:定量評価 • Blender Dataset(train: シングルスケール・test:マルチスケール) • PSNR↑は、3DGSに比べて、スケール変更に頑健な結果
実験結果:定性評価 • ズームアウト ◦ +EWA, Mip-splattingは膨張を抑えることができている Mip-splatting
実験結果:定性評価 • ズームイン ◦ Mip Splattingでは高周波ノイズ(サドル上の筋など)を抑制 Mip-splatting
実験結果:Ablation • 3D Smoothing filter ◦ 省略すると、高解像度の場合に高周波ノイズが発生 ▪ 2D Mip
Filterに関してはその効果はあまりない • 2D Mip filter ◦ 省略すると、膨張ノイズが発生 • これら2つのfilterを除くと ◦ 小さなGaussianが生成されすぎて、Mip-NeRF360ではA100(40GB)に載らない
まとめ • CVPR2024でのトレンド ◦ 3DGS系の論文が多数採択。(高品質化、動的、セマンティクスの付与など) • Mip-Splatting ◦ 3DGSのZoom In/Outで発生するエイリアスを抑制した手法を提案(高品質化)。
◦ 3D Smoothing Filter ▪ 3D空間での最大周波数制約により、高周波ノイズを抑制。 ◦ 2D Mip Filter ▪ Gaussian Filterによって、2D画像空間での膨張ノイズを軽減。