中級グラフィックス入門～効率的なメッシュレット描画～

Slide 1

Slide 1 text

No content

Slide 85

Slide 85 text

88 bool CreateLodMeshlets(const ResMeshlets& meshlets, ResLodMeshlets& lodMesh) { // サブセットごとにLODメッシュレットに変換. std::vector subsets; Conversion(meshlets, subsets); // サブセットのメモリを確保. lodMesh.Subsets.resize(subsets.size()); uint32_t maxLodLevel = 0; // マテリアルごとに処理. for(size_t i=0; i input = std::move(subsets[i].Meshlets); // LOD範囲. ResLodRange range = {}; range.Offset = uint32_t(lodMesh.Meshlets.size()); range.Count = uint32_t(input.size()); // マテリアルごとの全LODを含むメッシュレット総数のカウンター. uint32_t totalMeshletCount = uint32_t(input.size()); lodMesh.Subsets[i].MaterialId = subsets[i].MaterialId; lodMesh.Subsets[i].MeshletOffset = range.Offset; lodMesh.Subsets[i].LodRangeOffset = uint32_t(lodMesh.LodRanges.size()); lodMesh.LodRanges.emplace_back(range); // メッシュレットを追加. add_range(lodMesh.Meshlets, input); // LODレベル. uint32_t lodIndex = 1; // 指定数に達するまでループ. while(input.size() > 1 && lodIndex < (kMaxLodLevels - 1)) { …. } // 総数を記録. lodMesh.Subsets[i].MeshletCount = totalMeshletCount; lodMesh.Subsets[i].LodRangeCount = lodIndex; maxLodLevel = max(maxLodLevel, lodIndex); } lodMesh.Positions = meshlets.Positions; lodMesh.Normals = meshlets.Normals; lodMesh.Tangents = meshlets.Tangents; lodMesh.TexCoords = meshlets.TexCoords; lodMesh.BoundingSphere = meshlets.BoundingSphere; lodMesh.MaxLodLevel = maxLodLevel; lodMesh.LodRanges.shrink_to_fit(); // 正常終了. return true; } // 接続性に基づいてメッシュレットをグループ化. auto groups = GroupMeshlets(input); bool isMerged = false; std::vector simplifies; for(const auto& group : groups) { // グループ化したものを1つのメッシュにマージして，ポリゴン削減する. auto mergedInfo = SimplifyGroup(group, input, meshlets.Positions, meshlets.VertexIndices); // マージされていなければ以降の処理はスキップ. if (!mergedInfo.IsMerged) continue; float parentError = 0; for(auto& id : group.MeshletIds) { const auto& meshlet = input[id]; parentError = max(parentError, meshlet.GroupError); } // ポリゴン削減されたメッシュを，新しくメッシュレットに分割. auto newOnes = BuildMeshlets(mergedInfo, meshlets.Positions, lodIndex, subsets[i].MaterialId, parentError); const auto groupError = mergedInfo.Error + parentError; for(auto& id : group.MeshletIds) { // 1つ前のLOD(=入力データinput)が今新しく作ったメッシュレットの親になる. const auto offset = lodMesh.LodRanges.back().Offset; auto& parent = lodMesh.Meshlets[offset + id]; parent.ParentError = groupError; parent.ParentBounds = mergedInfo.BoundingSphere; } // 新しいメッシュレットを追加. add_range(simplifies, newOnes); // マージした. isMerged = true; } // 1回もマージされなければおしまい. if (!isMerged) break; // 新しいメッシュレットに差し替える. input = std::move(simplifies); // LOD範囲を設定. range.Offset = uint32_t(lodMesh.Meshlets.size()); range.Count = uint32_t(input.size()); lodMesh.LodRanges.emplace_back(range); totalMeshletCount += range.Count; // LODレベルをカウントアップ. lodIndex++; add_range(lodMesh.Meshlets, input);

Slide 90

Slide 90 text

93 uint32_t options = meshopt_SimplifyLockBorder | meshopt_SimplifyErrorAbsolute; float groupError = 0.0f; // Quadratic Error Metrics. float permissiveError = 0.03f; // 許容誤差 (3%未満とする). assert(targetIndexCount > 0); std::vector indices(mergedIdx.size()); auto indexCount = meshopt_simplify( indices.data(), mergedIdx.data(), mergedIdx.size(), &mergedPos[0].x, mergedPos.size(), sizeof(asdx::Vector3), targetIndexCount, permissiveError, options, &groupError); indices.resize(indexCount); mergedIdx.clear(); mergedIdx.shrink_to_fit(); mergedPos.clear(); mergedPos.shrink_to_fit(); // エラー値を設定. result.Error = groupError; // 元の頂点インデックス番号を復元する. result.Indices.reserve(indices.size()); for(const auto& index : indices) { auto vertId = dict[index]; result.Indices.emplace_back(vertId); } // エラーが 0 なければ，マージされて変形した. result.IsMerged = (clusterError > 0.0f); std::unordered_map dict; // mergeIndex <---> verteIndex の辞書. // グループごとにマージする. std::vector mergedIdx; std::vector mergedPos; // 最大数でメモリ確保. mergedIdx.reserve(group.MeshletIds.size() * 256 * 3); mergedPos.reserve(group.MeshletIds.size() * 256); for(size_t i=0; i remap(mergedIdx.size()); auto vertexCount = meshopt_generateVertexRemap( remap.data(), mergedIdx.data(), mergedIdx.size(), mergedPos.data(), mergedPos.size(), sizeof(asdx::Vector3)); // 位置座標をリマップ. { std::vector pos(vertexCount); meshopt_remapVertexBuffer(pos.data(), &mergedPos[0].x, mergedPos.size(), sizeof(asdx::Vector3), remap.data()); mergedPos = std::move(pos); } // 辞書をリマップ. { std::unordered_map remapDict; for(const auto& pair : dict) { auto newIdx = pair.first; auto vertId = pair.second; newIdx = remap[newIdx]; remapDict.try_emplace(newIdx, vertId); } dict = std::move(remapDict); } // 頂点インデックスをリマップ. mergedIdx = std::move(remap); }

Slide 130

Slide 130 text

134 [outputtopology("triangle")] [numthreads(128, 1, 1)] void main ( uint threadId : SV_GroupThreadID, uint groupId : SV_GroupID, in payload Payload payload, out vertices MSOutput vertices[256], out indices uint3 indices [256], out primitives PrimOutput prims [256] ) { uint meshletIndex = payload.MeshletIndices[groupId]; MeshletInfo info = g_Meshlets[meshletIndex]; SetMeshOutputCounts(info.VertexCount, info.PrimitiveCount); MeshInstanceParam instanceParam = g_MeshInstances[g_Constants.InstanceId]; for(uint i=0; i<2; ++i) { uint id = threadId + i * 128; if (id < info.PrimitiveCount) { // プリミティブインデックスを設定. uint3 tris = GetPrimitiveIndex(id + info.PrimitiveOffset); float3 posW [3]; // カリング用ワールド位置座標. float2 posSS[3]; // カリング用スクリーン空間座標. for (uint j = 0; j < 3; ++j) { /* 頂点データ処理の実装 */ } // カリング処理. bool culled = false; culled |= IsBackFaceOrZeroArea(posW, g_TransParam.CameraPos); culled |= PrimitiveCulling(posSS); // プリミティブアトリビュートを出力. PrimOutput output = (PrimOutput) 0; output.Color.rgb = ToSRGB(HueToRGB(groupId * 1.71f)); output.Color.a = 1.0f; output.Culling = culled; prims[id] = output; } } } uint idx = tris[j]; // 頂点数を超える場合は処理しない. if (idx >= info.VertexCount) continue; float4 localPos = float4(g_Positions[idx + info.VertexOffset], 1.0f); float4 worldPos = mul(instanceParam.CurrWorld, localPos); float4 viewPos = mul(view, worldPos); float4 projPos = mul(proj, viewPos); float3 localNormal = g_Normals[idx + info.VertexOffset]; float3 worldNormal = normalize(mul((float3x3) instanceParam.CurrWorld, localNormal)); MSOutput output; output.Position = projPos; output.Normal = worldNormal; output.TexCoord = g_TexCoords[idx]; vertices[idx] = output; posW [j] = worldPos.xyz; posSS[j] = (projPos.xy / projPos.w) * 0.5f + 0.5f; bool PrimitiveCulling(float2 posSS[3]) { bool culled = false; float2 mini = 1.0f.xx; float2 maxi = 0.0f.xx; // 視錐台カリング. for (uint i = 0; i < 3; ++i) { mini = min(mini, posSS[i]); maxi = max(maxi, posSS[i]); } culled |= (any(mini > 1.0f) || any(maxi < 0.0f)); // カリングする. // 微小プリミティブカリング. maxi *= g_TransParam.RenderTargetSize.xy; mini *= g_TransParam.RenderTargetSize.xy; culled |= any(round(mini) == round(maxi)); // カリングする. return culled; }

Slide 217

Slide 217 text

221 #if ENABLE_OPTIMIZATION // 自分と同じシェーダを持っているレーンを調べて，シェーダ数を求める. uint4 mask = WaveMatch(shaderId); uint count = SumCountBits(mask); // 自分が最初だったら，シェーダ数を書き込む. uint lowLane = GetLowestLane(mask); if (WaveGetLaneIndex() == lowLane) { InterlockedAdd(g_ShaderIdCounter[shaderId], count); } uint index = 0; uint workCount = WaveActiveCountBits(true); if (WaveIsFirstLane()) { InterlockedAdd(g_WorkListCounter[0], workCount, index); } index = WaveReadLaneFirst(index); index += WavePrefixCountBits(true); #else // シェーダ数を数える. InterlockedAdd(g_ShaderIdCounter[shaderId], 1); // 書き込み番号を取得. int index = 0; InterlockedAdd(g_WorkListCounter[0], 1, index); #endif #if ENABLE_OPTIMIZATION // 自分と同じシェーダを持っているレーンを調べて，ローカル番号を求める. uint4 mask = WaveMatch(input.ShaderId); uint index = WaveMultiPrefixCountBits(true, mask); // シェーダ数を求める. uint count = SumCountBits(mask); uint lowLane = GetLowestLane(mask); // 自分が最初だったらシェーダ数を書き込み，ローカルオフセットを取得. uint localOffset = 0; uint globalOffset = 0; if (WaveGetLaneIndex() == lowLane) { InterlockedAdd(g_ShaderIdCounter[input.ShaderId], count, localOffset); globalOffset = g_ShaderIdOffset [input.ShaderId]; } // 同じシェーダを持つレーンで共有出来るようにする. localOffset = WaveReadLaneAt(localOffset, lowLane); globalOffset = WaveReadLaneAt(globalOffset, lowLane); // ローカルオフセットを足しこむ. index += localOffset; // グローバルオフセットを足しこむ. index += globalOffset; #else const uint shaderId = input.ShaderId; // 書き込み場所を取得. uint index = 0; InterlockedAdd(g_ShaderIdCounter[shaderId], 1, index); // グローバルオフセットを足しこむ. index += g_ShaderIdOffset[shaderId]; #endif // ビットを数え上げて、水平加算する. uint SumCountBits(uint4 mask) { uint4 count = countbits(mask); return dot(count, 1u.xxxx); } // レーンビットマスクの中から最も低いレーン番号を求める uint GetLowestLane(uint4 mask) { uint4 lowLanes = (uint4)(firstbitlow(mask) | uint4(0, 32, 64, 96)); return min(min(lowLanes.x, lowLanes.y), min(lowLanes.z, lowLanes.w)); }

Slide 247

Slide 247 text

251 [numthreads(8, 8, 1)] void main(uint3 dispatchId : SV_DispatchThreadID) { // エピポールを求める. float3 epipole = normalize(g_TransParam.Previous.CameraPos - g_TransParam.Current.CameraPos); // 射影空間でのエピポールを求める. float4 clipEpipole = mul(g_TransParam.Current.Proj, float4(epipole, 0.0f)); // UV空間でのエピポールを求める. float2 uvEpipole = normalize(clipEpipole.xy * 0.5f + 0.5f.xx); // テクスチャ座標を求める. float2 uv = (dispatchId.xy + 0.5f.xx) * g_TransParam.RenderTargetSize.zw; // 深度を取得. float zMax = g_SrcDepth.SampleLevel(LinearClamp, uv, 0.0f); // 穴埋めされていない箇所であることをチェック. if (zMax == -FLT_MAX) { // UV空間での検索方向を求める. float2 normalEpipole = normalize(uvEpipole * uv); // 検索の刻み幅を求める. float2 dUvStep = normalEpipole * g_TransParam.RenderTargetSize.zw; // エピポーラ検索を行う. for(uint mip=1; mip <= g_Constants.MipLevels; ++mip) { // 検索点を求める. float2 uvSearch = uv + dUvStep; // 検索点における深度を取得 float z = g_SrcDepth.SampleLevel(LinearClamp, uvSearch, mip); // 次のミップを調べるために，2倍する(テクセルサイズが2倍になるため). dUvStep *= 2.0f; // 深度が適切であるかどうかチェック. if (z != -FLT_MAX) { z = max(z, g_DstDepth[dispatchId.xy]); z += g_Constants.DepthBias; z = min(z, g_TransParam.Current.FarClip); // 正常終了. return; } } // 適切な深度が取得できない場合は，背景として遮蔽されない扱いにする. if (zMax < g_TransParam.Current.NearClip) zMax = g_TransParam.Current.FarClip; // ファー平面でクランプ. zMax = min(zMax, g_TransParam.Current.FarClip); // 検索に引っかからなかった場合のフォールバックとして書き込み. g_DstDepth[dispatchId.xy] = zMax; } }

Slide 267

Slide 267 text

• [Okuda 2019] 奥田雅史, 川名勇気, 落合仁美子, 二階堂将也, “『描画が出来る人』ってどうやって育てればいいんだろう？～描画エンジニア育成プロジェクトポストモーテム～”, CEDEC 2019 • [Wihlidal 2016] Grahm Wihlidal, “Optimizing the Graphics Pipeline with Compute”, GDC 2016. • [Uralsky 2019] Yury Uralsky, “MESH SHADING: Towards greater efficiency in geometry processing”, SIGGRAPH 2019 Courses: Advances in Real-Time Rendering in Games. • [Karis 2021] Brian Karis, Rune Stubbe, Graham Wihlidal, “A Deep Dive into Nanite Virtualized Geometry”, SIGGRAPH 2021 Courses: Advances in Real-Time Rendering in Games. • [Jansson 2024] Erik Jansson, “GPU-driven Rendering with Mesh Shaders in Alan Wake2”, Digital Dragons 2024. • [Lopez 2025] Nicolas Lopez, “Rendering ‘Assassin’s Creed Shadows’”, GDC 2025. • [Mishima 2025] Hitoshi Mishima, “RE ENGINE Meshlet Rendering Pipeline”, Rendering Engine Architecture Conference 2025. • [Microsoft 2021] Microsoft, “DirectX-Specs : HLSL Wave Size”, https://microsoft.github.io/DirectX-Specs/d3d/HLSL_SM_6_6_WaveSize.html, 2021. • [Microsoft 2023] Microsoft, “DirectX-Specs : Mesh Shader”, https://microsoft.github.io/DirectX-Specs/d3d/MeshShader.html, 2023. • [Microsoft 2024] Microsoft, “DirectXShaderCompile Wave Intrinsics”, https://github.com/microsoft/DirectXShaderCompiler/wiki/Wave-Intrinsics, 2024 • [shikihuiku 2020] shikihuiku, “HLSLのWave Intrinsicsについて”, https://shikihuiku.github.io/post/wave_intrinsics1/, 2020. • [Sreckovic 2024] , “Compute shader wave intrinsics tricks”, https://medium.com/@marehtcone/compute-shader-wave-intrinsics-tricks-e237ffb159ef, 2024. • [Honda 2019] 本多圭, “フラスタムカリング入門、良いフラスタムの作り方”, CEDEC 2019. • [Mishima 2018] 三嶋仁, “最新タイトルのグラフィックス最適化事例”, CEDEC 2018. • [Pohlmann 2021] Matthew Pohlmann, “Samurai Landscapes: Building and Rendering Tsushima Island on PS4”, https://gdcvault.com/play/1027352/Samurai- Landscapes-Building-and-Rendering, GDC 2021. 271

Slide 268

Slide 268 text

• [Hable 2021] John Hable, “Visibility Buffer Rendering with Material Graphs”, http://filmicworlds.com/blog/visibility-buffer-rendering-with-material-graphs/, 2021. • [Burns 2013] Christopher A. Burns, Warren A. Hunt, “The Visibility Buffer: A Cache-Friendly Approach to Deferred Shading”, The Journal of Computer Graphics Techniques, vol.2, no.2, pp.55-69, 2013. • [stack overflow 2017], stack overflow, “Radius of projected sphere in screen space”, https://stackoverflow.com/questions/21648630/radius-of-projected- sphere-in-screen-space, 2017. • [Garland 1997] Michael Garland, Paul S. Heckbert, “Surface simplification using quadric error metrics”, SIGGRAPH 97, pp.208-216, August 1997. • [Nam 2025] キュウキャル, 南相培, 佐光一輝, “モバイルにも使える軽量な構造を持つ仮想化ジオメトリシステムの設計と実装について”, CEDEC 2025. • [Kuth 2024] Bastian Kuth, Max Oberberger, Felix Kawala, Sander Reitter, Sebastian Michel, Matthaus Chadas, Quirin Meyer, “Towards Practical Meshlet Compression”, 2024. • [AMD 2024] AMD, “GPU Open : Meshlet compression”, https://gpuopen.com/learn/mesh_shaders/mesh_shaders-meshlet_compression, 2024. • [Cigolle 2014] Zina H. Cigolle, San Donow, Daniel Evangelakos, Michael Mara, Morgan McGuire, Quirin Meyer, “A Survey of Efficient Representations for Independent Unit Vectors”, Journal of Computer Graphics Techniques, Vol.3, No.2, pp.1-30, 2014. • [John White 3D 2017] John White 3D, “Signed Octahedron Normal Encoding”, https://johnwhite3d.blogspot.com/, 2017. • [Schüler2007] Christian Schüler, “Normal Mapping without Precomputed Tangents”, ShaderX5, Chapter 2.6, pp.131-140, 2007. • [Schüler2013] Christian Schüler, “Followup: Normal Mapping Without Precomputed Tangents”, http://www.thetenthplanet.de/archives/1180, 2013. • [Geffroy 2020] Jean Geffroy, Axel Gneiting, Yixin Wang, “Rendering the Hellscape of Doom Eternal”, SIGGRAPH 2020 Advances in Real-Time Rendering course, 2020. • [Ong 2023] Jeremy Ong, “Tangent Spaces and Diamon Encoding”, https://www.jeremyong.com/graphics/2023/01/09/tangent-spaces-and-diamond-encoding/, 2023. • [Mclaren 2022] James Mclaren, “Adventures with Deferred Texturing in Horizon Forbidden West”, GDC 2022. 272

Slide 269

Slide 269 text

• [Haar 2015] Ulrich Haar, Sebastian Aaltonen, “GPU-Driven Rendering Pipelines”, SIGGRAPH 2015: Advances in Real-Time Rendering in Games, 2015. • [Takeshige 2018] 竹重雅也, “DirectX Raytracing – The life of a ray tracing kernel”, CEDEC 2018. • [Akuzawa 2024] 阿久澤陽菜, ルフェマキシム, “Mesh shaderを活用したスキニングメッシュに対するサブディビジョンサーフェイス”, CEDEC 2024. • [Kapoulkine 2025] Arseny Kapoulkine, “meshoptimizer”, https://github.com/zeux/meshoptimizer, 2025. • [Wikipedia 2025a] Wikipedia, “Epipolar geometry, “, https://en.wikipedia.org/wiki/Epipolar_geometry, 2025 • [Wikipedia 2025b] Wikipedia, “Spherical cap”, https://en.wikipedia.org/wiki/Spherical_cap, 2025. • [Valient 2007] Michal Valient, “Deferred Rendering in Killzone 2”, GDC 2007. • [Legarde 2014] Sebastien Lagarde, Charles de Rousiers, “Moving Frostbite to Physically Based Rendering 3.0”, SIGGRAPH 2014 Course: Physically Based Shading in Theory and Practice, 2014. • [Engel 2016] Wolfgang Engel, “The filter and Culled Visibility Buffer”, GDC Europe 2016. • [Anagnostou 2018] Kostas Anagnostou, “GPU driven rendering experiments”, Digital Dragons 2018. • [KarypisLab 2022] Prof. George Karipis’s research group, “METIS”, https://github.com/KarypisLab/METIS, 2022. • [Baerentzen 2021] Andres Baerentzen, Eva Rotenberg, “Skeletonization via Local Separators”, ACM Transaction on Graphics, Vol.40, Issue 5, No.187, pp.1-18, 2021. • [monsho 2023] もんしょ, “もんしょの巣穴 DirectXの話第182回 Visibility Buffer”, https://sites.google.com/site/monshonosuana/directx%E3%81%AE%E8%A9%B1/directx%E3%81%AE%E8%A9%B1-%E7%AC%AC182%E5%9B%9E, 2023. • [Ciardi 2018] Francesco Cifariello Ciardi, “Intro to GPU Scalarization – Part 1”, https://flashypixels.wordpress.com/2018/11/10/intro-to-gpu-scalarization-part- 1/ • [Shocker 2023] Shocker_0x15, “現代のGPUの実行スタイルとレイトレ(2023)”, https://speakerdeck.com/shocker_0x15/modern-gpu-execution-and-ray-tracing, レイトレ合宿9 セミナー, • [Doghramachi 2017] Hawar Doghramachi, Jean-Normand Bucci, “Deferred+: Next-Gen Culling and Rendering for the Dawn Engine”, GPU Zen, pp.77-104, 2017. 273

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

Slide 40

Slide 40 text