我正在使用 NSight Compute 来分析启动一些 CUDA 内核的程序。我确信它们已经启动了;但是当我按下 NSight Compute 中的“播放”按钮时,尽管启用了所有内核的分析 - 程序分析结束(没有崩溃/失败) - 没有分析任何内核。这是为什么?
要确定这是为什么,不要只是“玩”到底。相反,按“->:”按钮,这将使您进入下一个内核启动,然后可能再次前进到下一个 API 调用(使用“->*”)。
执行其中一项操作后,您可能会在列出的“API Stream”下看到报告的一些错误。
示例:
在这种情况下,我们遇到了(最常见的第一次遇到)
ERR_NVGPUCTRPERM
错误 - 您的用户无权访问 GPU 性能计数器。您可以按照此处的说明添加此类权限。