"INTRODUCTION TO DIRECT X RAYTRACING" - Days of Future Past -

Slide 1

Slide 1 text

No content

Slide 27

Slide 27 text

2. 描画パス初期化 1. Final Output, GBuffer 構築 2. Ray Shaders 読込 3. Raytracing Pipeline State Object (PSO) 構築*1 4. Ray Shader Table を構築 class DxrRenderPass // Hit Group struct DxrHitGroup { std::wstring m_name; std::wstring m_closestHitShaderName; std::wstring m_intersectionShaderName; std::wstring m_anyHitShaderName; DxrComPtr m_shaderTable; UINT m_shaderTableStrideInBytes = UINT_MAX; } // 描画パス（padding は自動。わかりやすさを優先したデータメンバのレイアウト） class DxrRenderPass { public: DxrHitGroup m_hitGroupTriangle; DxrHitGroup m_hitGroupProceduralGeometry; std::wstring m_name; std::wstring m_raygenShaderName; std::wstring m_missShaderName; DxrComPtr m_rayGenShaderTable; DxrComPtr m_missShaderTable; UINT m_missShaderTableStrideInBytes = UINT_MAX; // DXR 非対応GPU DxrComPtr m_fallbackStateObject; // DXR 対応GPU DxrComPtr m_dxrStateObject; DxrComPtr m_rootSignature; DxrComPtr m_localRootSignature; UINT8 m_type; public: virtual ~ RenderPass(){} virtual void Terminate(); public: virtual void Execute(ID3D12CommandList* commandList, UINT frameIndex); }; // RaytracedGBuffer.hlsl: レイ生成シェーダ DispatchRays() コマンド実行時に起動するシェーダ。 [shader("raygeneration”)] void GBufferRaygenShader() { Ray ray = ComputeCameraRay(DispatchRaysIndex().xy, DispatchRaysDimensions().xy); RayDesc rayDesc; rayDesc.Origin = ray.origin ; rayDesc.Direction = ray.direction; rayDesc.TMin = 0; rayDesc.TMax = 10000; GBufferRayPayload rayPayload=false; // Scene に対して、Ray Trace して、GBuffer の成分となる位置、法線、Radiance を取得 TraceRay(g_sceneBVH ,, RAY_FLAG_CULL_BACK_FACING_TRIANGLES, 0xFF, 0, /* hit group offset */ 1, /* hit group stride */ 0, /* miss shader offset */ rayDesc , rayPayload); } CG 技術の実装と数理 2018 Shinya Morishige 2018 Ray Shader は、対応したhlsl ファイルを事前にコンパイルしておく。コンパイルしたバイナリを C++ Header としてインクルードして、実行ファイルにシェーダバイナリを結合する。 dxc.exe -T lib_6_1 -HV 2017 -O4 –Zpr /Zi RaytracedGBuffer.hlsl g_RaytracedGBuffer .¥output¥RaytracedBuffer.hlsl.h // main.cpp #include "RaytracingRaytracedGBuffer.hlsl.h“ D3D12_SHADER_BYTECODE shaderBin=CD3DX12_SHADER_BYTECODE((void*)g_RaytracedGBuffer,ARRAYSIZE(g_RaytracedGBuffer));

Slide 28

Slide 28 text

2. 描画パス初期化 1. Final Output, GBuffer 構築 2. Ray Shaders 読込 3. Raytracing Pipeline State Object (PSO) 構築*1 4. Ray Shader Table 構築 class DxrRenderPass // Hit Group struct DxrHitGroup { std::wstring m_name; std::wstring m_closestHitShaderName; std::wstring m_intersectionShaderName; std::wstring m_anyHitShaderName; DxrComPtr m_shaderTable; UINT m_shaderTableStrideInBytes = UINT_MAX; } // 描画パス（padding は自動。わかりやすさを優先したデータメンバのレイアウト） class DxrRenderPass { public: DxrHitGroup m_hitGroupTriangle; DxrHitGroup m_hitGroupProceduralGeometry; std::wstring m_name; std::wstring m_raygenShaderNames; std::wstring m_missShaderNames; DxrComPtr m_rayGenShaderTable; DxrComPtr m_missShaderTable; UINT m_missShaderTableStrideInBytes = UINT_MAX; // DXR 非対応GPU DxrComPtr m_fallbackStateObject; // DXR 対応GPU DxrComPtr m_dxrStateObject; DxrComPtr m_rootSignature; DxrComPtr m_localRootSignature; UINT8 m_type; public: virtual ~ RenderPass(){} void Terminate(); }; // main.cpp, 描画パスシェーダ DxrRenderPass& pass = m_renderPass[GBuffer]; pass.m_name = L“RaytracedGBuffer"; // RaytracedGBuffer.hlsl の raygeneration の関数名を指定する pass.m_raygenShaderName = L“GBufferRaygenShader”; // 同様に、miss, intersection, closesthit について .hlsl の関数名を指定する、Hit Group 名も決めておく。 // PSO は、描画パスごとに構築する（描画パスごとにShader や Local Root Sigunature が異なるため） void CreateRaytracingPSO(DxrRenderPass& outRenderPass) { CD3D12_STATE_OBJECT_DESC pso{ D3D12_STATE_OBJECT_TYPE_RAYTRACING_PIPELINE }; // PSO にShader Binary を関連付ける BuildDxilLibrarySubobjects(&pso,outRenderPass); // PSO にHit Group (Closest/Intersection/AnyHit) を関連付ける BuildHitGroupSubobjects(&pso,outRenderPass); // PSO にRaytracing Shader の設定（Raytracing で運ぶ情報 payload サイズ上限など）を関連付ける BuildShaderConfigSubobjects(&pso,outRenderPass); // PSO にLocal Root Sigunature (arguments) を関連付ける(シェーダ個別のRoot Sigunature） BuildLocalRootSigunatureSubobjects(&pso,outRenderPass); // PSO にGlobal Root Sigunature (arguments) を関連付ける (シェーダ共通のRoot Sigunature） BuildGlobalRootSigunatureSubobjects(&pso,outRenderPass); // PSO にPipeline の設定（Raytracing でのトレース深さ上限など）を関連付ける BuildPipelineConfigSubobjects(&pso,outRenderPass); // PSO 構築（DXR 非対応GPU と対応GPU で構築に使うデバイスが異なる） if (RaytracingAPI::FallbackLayer == m_raytracingAPI) { // DXR 非対応GPU m_fallbackDevice->CreateStateObject(pso, IID_PPV_ARGS(&outRenderPass.m_fallbackStateObject)); } else { // DXR 対応GPU m_dxrDevice->CreateStateObject(pso, IID_PPV_ARGS(&outRenderPass.m_dxrStateObject)); } } CG 技術の実装と数理 2018 Shinya Morishige 2018 レイトレーシング用のPSO （描画パイプライン）を構築する。 PSO は、描画コールDispatchRays() 単位で用意する。 PSO は使うシェーダやHit Group、Root Sigunature (Global/Local, シェーダ固有のGPU リソース）, レイトレ用のシェーダ設定（Payload サイズ上限など）, パイプライン設定（トレースの深さ上限）をまとめたオブジェクト。それぞれの関数の詳細は、後日公開のGitHub 参照

Slide 29

Slide 29 text

2. 描画パス初期化 1. Final Output, GBuffer 構築 2. Ray Shaders 読込 3. Raytracing Pipeline State Object (PSO) 構築*1 4. Ray Shader Table 構築 class DxrShaderTable // Shader Record は、ShaderID と Local Root Arguments を記録する class DxrShaderRecord { public: void* m_shaderId = nullptr; void* m_localRootArguments = nullptr; uint32_t m_shaderIdSize = 0; uint32_t m_localRootArgumentsSize = 0; void CopyTo(void* dst) const; }; // Shader Table class DxrShaderTable : public YourGraphics::GpuBuffer { private: uint8_t* m_ptr = nullptr; UINT m_recordSize = D3D12_RAYTRACING_SHADER_RECORD_BYTE_ALIGNMENT; std::wstring m_name; std::vector m_recordArray; public: DxrShaderTable(UINT recordCount, UINT recordSize, const std::wstring& name) : m_name(name) { // Shader Record サイズは、16 byte アライメント m_recordSize = recordSize; m_recordArray.reserve(recordCount); UINT bufferSize = recordCount * m_recordSize; Alloc(bufferSize); m_ptr = map(); } void Register(const DxrShaderRecord& record) { m_recordArray.push_back(record); record.CopyTo(m_ptr); m_ptr += m_recordSize; } UINT GetRecordSize() { return m_recordSize; } }; // main.cpp, Shader Table 構築 DxrRenderPass& pass = m_renderPass[GBuffer]; void BuildShaderTables(DxrRenderPass& outRenderPass) { // Shader ID のサイズ取得（Shader Tableは複数のShader Recordを持ち、レコードのオフセットサイズとして使う） // Shader Record は、Shader ID と Local Root Arguments （インスタンスごとのマテリアルなど）を持つ。 // 今回は、Shader ID のみとする。 void* rayGenShaderID = nullptr; UINT shaderIDSize = 0; if (RaytracingAPI::FallbackLayer == m_raytracingAPI) { shaderIDSize = m_fallbackDevice->GetShaderIdentifierSize(); rayGenShaderID = outRenderPass.m_fallbackStateObject->GetShaderIdentifier(outRenderPass.m_raygenShaderNames.c_str()); } else { shaderIDSize = m_dxrDevice->GetShaderIdentifierSize(); rayGenShaderID = outRenderPass.m_dxrStateObject->GetShaderIdentifier(outRenderPass.m_raygenShaderNames.c_str()); } // Ray Generation Shader DxrShaderTable rayGenShaderTable(1, shaderIDSize, L"RayGenerationShaderTable" ); rayGenShaderTable.Register(DxrShaderRecord(rayGenShaderID, shaderIDSize, nullptr, 0)); outputRenderPass.m_rayGenShaderTable = rayGenShaderTable.GetGpuResource(); // 同様に Miss Shader, Hit Group Shader についてもShader Table を構築する } CG 技術の実装と数理 2018 Shinya Morishige 2018 Shader Table を構築する。 Shader Table で、レイトレースごとに、シェーダとリソースを切り替えることができる。 TraceRay() の引数にShader Record のインデックスを指定して切り替える。 Shader Table は、Shader Record を複数持つ。 Shader Record は、Shader ID と Local Root Arguments を持つ。

Slide 33

Slide 33 text

5. レイトレーシングの実行 1. RaysDispatch() Command 実行 // DXR 非対応GPU と対応GPU の両方に対応した DispatchRays() void DispatchRays(auto* commandList, auto* stateObject, auto* dispatchDesc) { dispatchDesc->HitGroupTable.StartAddress = m_hitGroupShaderTable->GetGPUVirtualAddress(); dispatchDesc->HitGroupTable.SizeInBytes = m_hitGroupShaderTable->GetDesc().Width; dispatchDesc->HitGroupTable.StrideInBytes = m_hitGroupShaderTableStrideInBytes; dispatchDesc->MissShaderTable.StartAddress = m_missShaderTable->GetGPUVirtualAddress(); dispatchDesc->MissShaderTable.SizeInBytes = m_missShaderTable->GetDesc().Width; dispatchDesc->MissShaderTable.StrideInBytes = m_missShaderTableStrideInBytes; dispatchDesc->RayGenerationShaderRecord.StartAddress = m_rayGenShaderTable->GetGPUVirtualAddress(); dispatchDesc->RayGenerationShaderRecord.SizeInBytes = m_rayGenShaderTable->GetDesc().Width; dispatchDesc->Width = m_outputWidth; dispatchDesc->Height = m_outputHeight; commandList->DispatchRays(stateObject, dispatchDesc); } // BLAS インスタンスごとに設定する定数バッファ struct BlasInstancePerFrameBuffer { Float4x4 m_localToBLAS; Float4x4 m_blasToLocal; }; // Scene 定数バッファ struct SceneConstantBuffer { Float4x4 m_projectionToWorld; Float4 m_cameraPosition; Float4 m_cameraDirection; Float4 m_lightPosition; float m_elapsedTime; float m_aoRadius; float m_aoRayMinT; float m_indirectRayMinT; int m_aoRaySampleCount; int m_indirectRaySampleCount; int m_frameCount; int m_padding; }; // dxrRaytracedGBufferRenderPass.cpp SceneConstantBuffer m_sceneData; BlasInstancePerFrameBuffer m_blasInstanceBuffer; void DxrRaytracedGBufferRenderPass::Execute(ID3D12GraphicsCommandList* commandList, UINT frameIndex) { // GBuffer 出力先UAV を設定 Position が先頭, Normal, Diffuse, Specular と続く commandList->SetComputeRootDescriptorTable(OutputSlot, m_output[Position].m_gpuHandleUav); // シェーダ共通の Global Root Signature 設定 commandList->SetComputeRootSignature(m_globalRootSignature.Get()); // GPU リソース設定 commandList->SetComputeRootConstantBufferView(SceneSlot, m_sceneData.GpuVirtualAddress(frameIndex)); commandList->SetComputeRootShaderResourceView(ProceduralGeometryAttributeSlot, m_blasInstanceBuffer.GpuVirtualAddress(frameIndex)); if (RaytracingAPI::FallbackLayer == m_raytracingAPI) { // DXR 非対応GPU D3D12_FALLBACK_DISPATCH_RAYS_DESC dispatchDesc = {}; m_fallbackCommandList->SetDescriptorHeaps(1, m_descriptorHeap.GetAddressOf()); m_fallbackCommandList->SetTopLevelAccelerationStructure(AsSlot, m_fallbackTLASPointer); DispatchRays(m_fallbackCommandList.Get(), m_fallbackStateObject.Get(), &dispatchDesc); } else { // DXR 対応GPU D3D12_DISPATCH_RAYS_DESC dispatchDesc = {}; m_dxrCommandList->SetDescriptorHeaps(1, m_descriptorHeap.GetAddressOf()); commandList->SetComputeRootShaderResourceView(AsSlot, m_tlas->GetGPUVirtualAddress()); DispatchRays(m_dxrCommandList.Get(), m_dxrStateObject.Get(), &dispatchDesc); } }; CG 技術の実装と数理 2018 Shinya Morishige 2018 class DxrRenderPass

Slide 36

Slide 36 text

AMBIENT OCCLUSION 1. Ray Generation Shader 2. Miss Shader 3．Intersection Shader (Procedural Geometry Only) // AmbientOcclsuion.hlsl: レイ生成シェーダ DispatchRays() 実行時に起動するシェーダ。 RWTexture2D g_renderTargetAo : register(u4, space0); RaytracingAccelerationStructure g_sceneBVH : register(t0, space0); Texture2D g_renderTargetPosition : register(t4, space0); Texture2D g_renderTargetNormal : register(t5, space0); ConstantBuffer g_sceneConstant : register(b0); [shader("raygeneration”)] void AoRaygenShader() { uint2 index = DispatchRaysIndex().xy; float4 worldPos = g_renderTargetPosition[index]; float4 worldNormal = g_renderTargetNormal[index]; uint sampleRayCount = g_sceneConstantBuffer.aoSampleCount; float visibleRay = float(sampleRayCount);); // GBuffer Position のw 成分で背景かどうかを判定 if (worldPos.w != 0.0f) { visibleRay = 0.0f; for(int i = 0;;i < sampleRayCount; ++i) {{ // Surface Normal 中心に半球サンプリング float3 sampleWorldDir = SampleUniformHemisphere(seed,worldNormal.xyz); float minT = g_sceneConstantBuffer.aoRayMinT; // 小さすぎると、アクネがでる。 float radius = g_sceneConstantBuffer.aoRadius;; // AO 半径 = Ray の距離上限 AoRayPayload rayPayload =0.0f; RayDesc rayAO; rayAO.Origin = worldPos.xyz; rayAO.Direction = sampleWorldDir.xyz; rayAO.TMin = minT; rayAO.TMax = radius; TraceRay(g_sceneBVH, RAY_FLAG_ACCEPT_FIRST_HIT_AND_END_SEARCH | RAY_FLAG_SKIP_CLOSEST_HIT_SHADER, 0xFF, 0, 1, 0, rayAO, rayPayload); visibleRay += rayPayload.visibleRay; } } float aoColor = visibleRay / float(sampleRayCount); g_renderTargetAo[index] = float4(aoColor, aoColor, aoColor,1.0f); } CG 技術の実装と数理 2018 Shinya Morishige 2018 [shader"miss"] void AoMissShader(inout AoRayPayload rayPayload){ // 完全に可視 (遮蔽されていない） rayPayload.visibleRay = 1.0f; } // 完全球の衝突判定 StructuredBuffer g_instanceBuffer : register(t3,space0) ConstantBuffer g_sphereConstantBuffer: register(b2) [shader("intersection"] void AoIntersectionShader_ProceduralGeometry(){ // レイをSphere を構成するAABB 中心の座標系に変換（Procedural Geometry はAABB とシェーダで表現） Ray localRay = GetRayInSphereLocalSpace(); float hitT; ProceduralGeometryAttributes attr; // 球として衝突検出したAABB のインデックス取得して、衝突を通知。 if (RaySphereIntersectionTest(localRay, hitT, attr)){ #if 0 // AO 計算ではワールド法線は不要。Indirect Diffuse 計算で必要になる。 BlasInstanceBuffer sphereAttribute = g_instanceBuffer[g_sphereConstantBuffer.instanceIndex]; attr.normal = mul(attr.normal,float3x3(sphereAttribute.localSpaceToBottomLevelAS); attr.normal = normalize(mul(float3x3(ObjectToWorld,attr.normal)); #endif ReportHit(hitT,0,attr); } }

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

Slide 40

Slide 40 text