为什么 NSight Compute “缺少”我的程序的内核启动?

问题描述 投票:0回答:1

我正在使用 NSight Compute 来分析启动一些 CUDA 内核的程序。我确信它们已经启动了;但是当我按下 NSight Compute 中的“播放”按钮时,尽管启用了所有内核的分析 - 程序分析结束(没有崩溃/失败) - 没有分析任何内核。这是为什么?

cuda profiling nsight-compute
1个回答
0
投票

要确定这是为什么,不要只是“玩”到底。相反,按“->:”按钮,这将使您进入下一个内核启动,然后可能再次前进到下一个 API 调用(使用“->*”)。

执行其中一项操作后,您可能会在列出的“API Stream”下看到报告的一些错误。

示例:

Part of an NSight Compute app window

在这种情况下,我们遇到了(最常见的第一次遇到)

ERR_NVGPUCTRPERM
错误 - 您的用户无权访问 GPU 性能计数器。您可以按照此处的说明添加此类权限。

© www.soinside.com 2019 - 2024. All rights reserved.