cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

torch.cuda.is_available() 返回 false,我还应该检查什么?

内容: 我在让 PyTorch 识别我的系统上的 CUDA 时遇到问题。详细信息如下: 系统信息: 操作系统:在 WSL2 上运行的 Ubuntu 22.04.4 LTS (x86_64) Python版本:3.7.16 PyTorch

回答 1 投票 0

shfl.sync.idx 什么时候快?

使用 shfl.sync 的 .idx 选项,可以在单个 warp 中的线程之间任意排列寄存器。希望通过使用 shfl.sync,您可以避免存储然后加载数据...

回答 1 投票 0

CUDA共享内存编程不起作用

全部: 我正在学习共享内存如何加速 GPU 编程过程。我使用下面的代码来计算每个元素的平方值加上其平均值的平方值...

回答 1 投票 0

CUDA 动态并行的替代方案

我想我对 CUDA 编程模型和一般编程非常陌生。我正在尝试并行化期望最大化算法。我正在开发具有计算功能的 gtx 480

回答 1 投票 0

在 nvcuda.dll 中找不到 cudaDeviceSynchronize()

我正在编写CUDA代码,在VS2022中使用nvcc编译它,生成PTX文件,并从Embarcadero Delphi运行CUDA代码。为了从 Delphi 运行 CUDA 内核,我编写了一个 API

回答 1 投票 0

pycuda 找不到内核 cuModuleGetFunction 失败:未找到命名符号

我有以下脚本尝试在图像上绘制矩形 导入CV2 将 numpy 导入为 np 导入 pycuda.autoinit 将 pycuda.driver 导入为 cuda 从 pycuda.compiler 导入 SourceModule 定义

回答 1 投票 0

从 std::deque 复制到推力 device_vector

我正在尝试制作一个示例代码,从 std::deque 复制到推力::device_vector,但编译器警告不允许从 __host__ __device__ 函数调用 __host__ 函数(我...

回答 1 投票 0

CUDA 编译器无法检测到(GPU)设备上调用的主机函数

请看这段代码: 无效栏(){} __host__ __device__ 无效 foo() { 酒吧(); } __global__ 无效内核() { foo(); } int main() { 内核<<<1, 1>>>(); gpuErrchk(

回答 2 投票 0

每次我想将GPU与Tensorflow(WSL)一起使用时都必须导出CUDNN_PATH

我遇到的问题是,在安装最新版本的 Tensorflow (2.16.1) 时,它没有使用 GPU。 仅在运行以下命令后,它才能识别 GPU(如本中所建议的...

回答 1 投票 0

`ptxas 警告:Tensorflow 和 PyTorch 上的寄存器溢出到本地内存

在我们的一项研究中,我们将 Tensorflow 和 Pytorch 与其他主要模型一起使用。每当我们在大学使用数据服务器时,我们都可以在模型训练中使用完整的 GPU。电脑上有一个

回答 1 投票 0

尝试从另一个文件的全局函数调用设备函数

作为 GPU 编程(以及某种 CMake)的初学者,我一直在尝试使用 CMake 和 CUDA 制作一个小项目,但我遇到了问题,所以我想知道一种执行以下操作的方法: 好吧,让...

回答 1 投票 0

numba.cuda.close()之后如何使用GPU?

我在jupyter笔记本上使用tensorflow。假设我想刷新 GPU 内存中的所有内容而不重新启动内核(这意味着不触及 RAM 内容)。请不要潜入

回答 1 投票 0

在 Visual Studio 中使用 CUDA 编译和运行 OpenCV 项目时出现问题,net.forward();

我在 Visual Studio 中使用 CUDA 编译和运行 OpenCV 项目时遇到问题。我在 Windows 11 中使用 Visual Studio 2022,并使用 CUDA 12.1 和 CUDN 配置了 OpenCV 4.8.0...

回答 1 投票 0

__grid_constant__ 参数限定符有什么作用?

几周前,NVIDIA 的 Stephen Jones 进行了一场题为“CUDA:新功能及超越”的 GTC 演讲,其中他介绍了 CUDA v11.7 中即将推出的功能:内核限定符/装饰器

回答 1 投票 0

并行归约算法中的共享内存库冲突

我正在阅读 Nvidia 的幻灯片(优化 CUDA 中的并行缩减),讨论并行缩减算法。 幻灯片 15: 在这里,作者讨论了通过使用顺序寻址,我们

回答 2 投票 0

CUDA使用NVIDA卡,视频使用主板

我想使用主板作为主显示适配器,并使用 NVIDIA 显卡作为专用 CUDA 处理器。我的第一个想法是简单地将显示器的 VGA 线插入主板......

回答 4 投票 0

在设备函数 CUDA 中引用倾斜指针

我已经使用 cudaMalloc3D 使用 cudaPitchedPtr 创建了一个 3D 矩阵,我也想从设备函数引用创建的矩阵。是否将倾斜指针复制到 __device__

回答 1 投票 0

如何在 CUDA 中有效地设置位向量的位?

任务类似于如何并行有效地设置位向量的位?,但是对于 CUDA。 考虑其中有 N 位的位向量(N 很大,例如 4G)和 M 个数字的数组(M 也很大,例如...

回答 1 投票 0

使用未启用 CUDA 的 GPU 进行深度学习

我的笔记本电脑上有 Nvidia GeForce GTX 1650。它没有启用cuda。我可以将此 GPU 与 TensorFlow 和 pytorch 一起使用吗?除了 CUDA 之外还有什么可以使用的吗? 我尝试安装不同的版本...

回答 1 投票 0

nvidia/cuda和tensorflow/tensorflow图像之间的区别

从 GPU 支持的角度来看,tensorflow/tensorflow 图像与 nvidia/cuda docker 图像有什么根本不同?我不关心例如Python 的东西。比如说我...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.