我想通过nvprof生成限制配置文件。如何将分析时间限制在5秒钟?
nvprof有一个timeout
选项。来自documentation:
可以向nvprof提供超时(以秒为单位)。正在分析的CUDA应用程序将在超时后被nvprof杀死。将显示超时前收集的分析结果。
注意:超时从CUDA驱动程序初始化的那一刻开始计算。如果应用程序未调用任何CUDA API,则不会触发超时。
您还可以标记应该应用nvprof的起点和终点。这可以使用cudaProfilerStart()
和cudaProfilerEnd()
明确地完成,或者使用生命周期的cuda::profiling::scope
对象(来自我的Modern C++ CUDA API wrappers)以隐式的RAII方式完成。
请记住,如果您使用nvvp,请不要选中该框,告诉它分析整个运行。