cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

有没有办法在docker容器之间发送pytorch张量在GPU内存中的位置并在不同的容器中构建它们

为了快速总结问题,我需要在 PyTorch docker 容器之间传输图像(大小为 (1920,1200,3))并处理它们。容器位于同一系统中。速度非常重要...

回答 1 投票 0

CUDA 5.0,编译错误

下面的代码给出了一个错误,我看不出任何原因。有人可以让我知道我做错了什么吗? __global__ void thekernel(float *device_a, int CELLS, int LVLS) { ...

回答 1 投票 0

为什么CUDA在测试写入性能时,在轻负载下,write through(添加 volatile 关键字)和 write back 表现出相似的性能

我觉得轻负载下,因为回写需要先将数据写入缓存,等待刷新到全局内存,这种模式应该会造成性能浪费,因为有w...

回答 1 投票 0

GPU L1 缓存一致性

在OpenCL和CUDA中,分别有一些原语,即barrier()和__syncthreads(),来强制L1数据缓存/共享内存的一致性。这是否意味着缓存本身不兼容...

回答 2 投票 0

指令调度对于PTX有多重要? [已关闭]

据我了解,PTX 的主要优势是为您提供一些具体的说明。它也是中级编程语言。这意味着,nvidia 编译器不会直接执行...

回答 1 投票 0

CuPy 未找到 cuSPARSELt

我很难让 CuPy 在 Windows 中检测和使用(如果适用)cuSPARSELt 库。我尝试安装版本 0.2.0(如 CuPy 的安装指南所述)和 0.6.2(...

回答 1 投票 0

我可以在没有 nvcc 编译器的情况下执行 C 语言的内核函数吗

我有一个问题(CUDA)我可以在没有 nvcc 编译器的情况下在 C 上执行内核函数吗?我被问到这个问题,他们告诉我,如果您直接从 CUDA 驱动程序 API 调用 Call,就可以完成...

回答 1 投票 0

用于 pyTorch 的 eGPU?

是否有外部 GPU(例如 Coral Edge TPU USB 加速器) 与 pytorch 兼容还是我需要 NVIDIA 支持CUDA的显卡? 我还没有找到使用 Coral Edge T 的方法...

回答 1 投票 0

CUDA C++:CUDA 的 Nvcc 不允许在变量模板专门化中使用不完整的数组类型

我正在尝试将 AMD lib rocBLAS 移植到 nvdia 平台。我找到了这些陈述:\ 模板 char XXString[] = "无效"; 模板 <> char XXString[] = ...

回答 1 投票 0

编译 CUDA 库:适用于 Mac,不适用于 Ubuntu

我正在第一次尝试构建一个充满 CUDA 例程的 .so。我有matrix_vector_mult.cu 文件目前什么也不做: #包括 外部“C” 双倍的 * 矩阵向量乘(

回答 2 投票 0

如何将加速器启动添加到 VS Code 调试器?

我的终端中不断出现错误: ConnectionRefusedError: [Errno 111] 连接被拒绝 我通过尝试添加以下命令得到了上述错误: 加速启动 --num_processes=1 --num_mach...

回答 1 投票 0

混合 CUDA 和 C++ 的 CMake 项目导致错误 cudart_static.lib LNK2005 XXX 已在 cudart_static.lib 中定义

我有一个类似于下面的CMake项目: cmake_minimum_required(版本3.22) 项目(示例 描述“D3D11、CUDA 11.8 和 libtorch 2.0.1 之间的互操作示例(CUDA 11.8...

回答 1 投票 0

TORCH_USE_CUDA_DSA 启用设备端断言

我正在尝试使用 1L 数据集微调 llama 3 模型,我在训练之间遇到了下面提到的错误,准确地说,我在完成 30k 步后得到了这个错误。使用 2 个 GPU 进行训练...

回答 1 投票 0

jax 库错误 jaxlib.xla_extension.XlaRuntimeError: FAILED_PRECONDITION: DNN 库初始化失败

我正在编写使用 Jax 库的代码,无论我如何尝试配置环境,我都会一遍又一遍地遇到此错误: 2024-08-20 16:26:58.037892:E 外部/xla/xla/

回答 1 投票 0

CUDA 和 OpenCL GPU 内核函数排队太慢。有没有更快的方法或技术?也许是未来?这是一个已知问题吗?

背景 过去一周我一直在做使用 GPU 进行音频处理/合成的实验,例如在有限差分建模(例如波动方程)等领域,其中方程...

回答 1 投票 0

使用(现有的)较低版本的gcc进行编译而不是降级

我尝试从支持 CUDA 的源代码编译 AMBER(MD 模拟软件),出现以下错误: [ 52%] 构建 NVCC(设备)对象 AmberTools/src/quick/src/libxc/maple2c_d...

回答 1 投票 0

如何在VS2019 CUDA项目中启用C++17代码生成

我正在将一些代码从一台电脑上的 VS2017 移动到另一台装有 VS2019 的电脑。一切都很好,除了我不能使用 std::filesystem 。在我以前的代码中,我使用的是 C++14 并具有 std::experimental::

回答 1 投票 0

以音频速率进行 OpenCL/CUDA GPU 计算 - 有没有足够快的方法可以从 GPU 读取每个音频缓冲区一次? (即,至少 ~43 FPS)

问题 我最近尝试将 OpenCL 添加到音频合成器中,该合成器将受益于 GPU 处理(由于处理中的高度并行数学)。然而,我发现即使只是 tr...

回答 1 投票 0

Cuda Julia 示例抛出错误:不允许从 __device__ 调用 __host__ 函数。为什么?

这是代码,如果你用nvcc编译它,它会给我错误: 从 __device__ 函数调用 __host__ 函数("cuComplex::cuComplex(float, float)") ("cuComplex::operator *&

回答 1 投票 0

ComfyUI 没有可用的 CUDA GPU

我正在尝试在 Ubuntu 22.04.4 LTS 上设置 ComfyUI,但 CUDA 出现问题。我已按照此处的教程进行操作:https://medium.com/@yushantripleseven/installing-comfyui-linux-windows-b59a57af61b6。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.