DirectX12 CPU / GPU 同步问题

问题描述 投票:0回答:1

我试图了解 DirectX 12 中的 CPU / GPU 同步,但有些事情让我感到困惑。这是来自 Microsoft 的

HelloFrameBuffering
example 的示例代码:

// Prepare to render the next frame.
void D3D12HelloFrameBuffering::MoveToNextFrame()
{
    // Schedule a Signal command in the queue.
    const UINT64 currentFenceValue = m_fenceValues[m_frameIndex];
    ThrowIfFailed(m_commandQueue->Signal(m_fence.Get(), currentFenceValue));

    // Update the frame index.
    m_frameIndex = m_swapChain->GetCurrentBackBufferIndex();

    // If the next frame is not ready to be rendered yet, wait until it is ready.
    if (m_fence->GetCompletedValue() < m_fenceValues[m_frameIndex])
    {
        ThrowIfFailed(m_fence->SetEventOnCompletion(m_fenceValues[m_frameIndex], m_fenceEvent));
        WaitForSingleObjectEx(m_fenceEvent, INFINITE, FALSE);
    }

    // Set the fence value for the next frame.
    m_fenceValues[m_frameIndex] = currentFenceValue + 1;
}

我的问题是,为什么我们要在检查栅栏是否达到预期栅栏值之前更新

m_frameIndex
?这意味着我们使用不同帧缓冲区的栅栏值,该值与我们在
Signal()
调用中使用的值不同。 这对我来说似乎有点奇怪。

我还查看了 Nvidia 的示例代码,这是他们的版本:

struct FrameContext
{
    ComPtr<ID3D12CommandAllocator> m_allocator;
    ComPtr<ID3D12CommandAllocator> m_computeAllocator;
    ComPtr<ID3D12Fence>            m_fence;
    uint64_t                       m_fenceValue = 0;
};

void DeviceResources::MoveToNextFrame()
{
    FrameContext* ctx = &m_frameContext[m_frameIndex];
    DX::ThrowIfFailed(m_commandQueue->Signal(ctx->m_fence.Get(), ctx->m_fenceValue));
    m_frameIndex = m_swapChain->GetCurrentBackBufferIndex();
    if (ctx->m_fence->GetCompletedValue() < ctx->m_fenceValue)
    {
        DX::ThrowIfFailed(ctx->m_fence->SetEventOnCompletion(ctx->m_fenceValue, m_fenceEvent.Get()));
        WaitForSingleObjectEx(m_fenceEvent.Get(), INFINITE, false);
    }
    ctx->m_fenceValue++;
}

正如我们所看到的,他们使用相同的栅栏值来调用“Signal()”并与“GetCompletedValue()”进行比较。有人可以帮助我了解这两种方法的优缺点吗?

提前致谢!

c++ graphics directx directx-12
1个回答
0
投票

D3D12HelloFrameBuffering::MoveToNextFrame
我也很困惑。我认为这只是每个人都复制的一种模式,而不是他们推理的模式。

我想出了自己的 Nvidia 解决方案的帧缓冲版本(不是帧缓冲)。

诀窍是将其视为环形/循环缓冲区问题。您想要在自然中工作,然后将它们投影到

modulo FrameCount
(即,当您索引到环形缓冲区时,您会去
buffer[index % FrameCount]
,但只会以
index += 1
的形式递增)。

您有两个索引。但我使用哨兵,即指向一个解析结尾的索引。

sentinel_gpu_completed
,您从
ID3D12Fence::GetCompletedValue()
获得。

sentinel_cpu_record
您自己管理。

关键是要确保

sentinel_cpu_record - sentinel_gpu_completed < FrameCount

auto sentinel_gpu_completed = m_fence->GetCompletedValue();
if (not (sentinel_cpu_record - sentinel_gpu_completed < FrameCount))
{
    winrt::check_hresult(m_fence->SetEventOnCompletion(sentinel_cpu_record - (FrameCount - 1), m_fenceEvent.get()));
   WaitForSingleObject(m_fenceEvent.get(), INFINITE);
}
// sumbit render commands for frame
sentinel_cpu_record += 1;
最新问题
© www.soinside.com 2019 - 2025. All rights reserved.