我试图了解 DirectX 12 中的 CPU / GPU 同步,但有些事情让我感到困惑。这是来自 Microsoft 的
HelloFrameBuffering
example 的示例代码:
// Prepare to render the next frame.
void D3D12HelloFrameBuffering::MoveToNextFrame()
{
// Schedule a Signal command in the queue.
const UINT64 currentFenceValue = m_fenceValues[m_frameIndex];
ThrowIfFailed(m_commandQueue->Signal(m_fence.Get(), currentFenceValue));
// Update the frame index.
m_frameIndex = m_swapChain->GetCurrentBackBufferIndex();
// If the next frame is not ready to be rendered yet, wait until it is ready.
if (m_fence->GetCompletedValue() < m_fenceValues[m_frameIndex])
{
ThrowIfFailed(m_fence->SetEventOnCompletion(m_fenceValues[m_frameIndex], m_fenceEvent));
WaitForSingleObjectEx(m_fenceEvent, INFINITE, FALSE);
}
// Set the fence value for the next frame.
m_fenceValues[m_frameIndex] = currentFenceValue + 1;
}
我的问题是,为什么我们要在检查栅栏是否达到预期栅栏值之前更新
m_frameIndex
?这意味着我们使用不同帧缓冲区的栅栏值,该值与我们在 Signal()
调用中使用的值不同。 这对我来说似乎有点奇怪。
我还查看了 Nvidia 的示例代码,这是他们的版本:
struct FrameContext
{
ComPtr<ID3D12CommandAllocator> m_allocator;
ComPtr<ID3D12CommandAllocator> m_computeAllocator;
ComPtr<ID3D12Fence> m_fence;
uint64_t m_fenceValue = 0;
};
void DeviceResources::MoveToNextFrame()
{
FrameContext* ctx = &m_frameContext[m_frameIndex];
DX::ThrowIfFailed(m_commandQueue->Signal(ctx->m_fence.Get(), ctx->m_fenceValue));
m_frameIndex = m_swapChain->GetCurrentBackBufferIndex();
if (ctx->m_fence->GetCompletedValue() < ctx->m_fenceValue)
{
DX::ThrowIfFailed(ctx->m_fence->SetEventOnCompletion(ctx->m_fenceValue, m_fenceEvent.Get()));
WaitForSingleObjectEx(m_fenceEvent.Get(), INFINITE, false);
}
ctx->m_fenceValue++;
}
正如我们所看到的,他们使用相同的栅栏值来调用“Signal()”并与“GetCompletedValue()”进行比较。有人可以帮助我了解这两种方法的优缺点吗?
提前致谢!
D3D12HelloFrameBuffering::MoveToNextFrame
我也很困惑。我认为这只是每个人都复制的一种模式,而不是他们推理的模式。
我想出了自己的 Nvidia 解决方案的帧缓冲版本(不是帧缓冲)。
诀窍是将其视为环形/循环缓冲区问题。您想要在自然中工作,然后将它们投影到
modulo FrameCount
(即,当您索引到环形缓冲区时,您会去buffer[index % FrameCount]
,但只会以index += 1
的形式递增)。
您有两个索引。但我使用哨兵,即指向一个解析结尾的索引。
sentinel_gpu_completed
,您从 ID3D12Fence::GetCompletedValue()
获得。
sentinel_cpu_record
您自己管理。
关键是要确保
sentinel_cpu_record - sentinel_gpu_completed < FrameCount
auto sentinel_gpu_completed = m_fence->GetCompletedValue();
if (not (sentinel_cpu_record - sentinel_gpu_completed < FrameCount))
{
winrt::check_hresult(m_fence->SetEventOnCompletion(sentinel_cpu_record - (FrameCount - 1), m_fenceEvent.get()));
WaitForSingleObject(m_fenceEvent.get(), INFINITE);
}
// sumbit render commands for frame
sentinel_cpu_record += 1;