如何通过nvprof在短时间内分析CUDA应用程序?

问题描述 投票:0回答:2

我想通过nvprof生成限制配置文件。如何将分析时间限制在5秒钟?

cuda nvprof
2个回答
0
投票

nvprof有一个timeout选项。来自documentation

可以向nvprof提供超时(以秒为单位)。正在分析的CUDA应用程序将在超时后被nvprof杀死。将显示超时前收集的分析结果。

注意:超时从CUDA驱动程序初始化的那一刻开始计算。如果应用程序未调用任何CUDA API,则不会触发超时。


-1
投票

您还可以标记应该应用nvprof的起点和终点。这可以使用cudaProfilerStart()cudaProfilerEnd()明确地完成,或者使用生命周期的cuda::profiling::scope对象(来自我的Modern C++ CUDA API wrappers)以隐式的RAII方式完成。

请记住,如果您使用nvvp,请不要选中该框,告诉它分析整个运行。

© www.soinside.com 2019 - 2024. All rights reserved.