gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。

调用 vkCreateGraphicsPipelines 时出现分段错误

我在学习 Vulkan 教程时遇到了问题。 我几乎从教程代码中复制粘贴了整个 CreateGraphicsPipeline() 函数。然而我得到了细分......

回答 1 投票 0

UnimplementedError:图形执行错误:在tensorflow上运行nn

我一直遇到这个错误,我不知道为什么,特别是因为我完全遵循某人的代码并且该人在运行此代码时没有错误 img_shape = (128,128,3) # 加载预训练...

回答 4 投票 0

Visual Studio 2022 (AMD) 中的 HIP GPU 编程 - 未解析的外部:blockIdx、blockDim、threadIdx、hipLaunchKernelGGL

我正在尝试在现有的 Visual Studio 2022 (C++20) 项目中设置 HIP,以便我可以在 AMD 的 GPU 上运行我的代码。但是我收到一些未定义的标识符错误。 我下载了...

回答 1 投票 0

如何增加每秒连续 CUDA 调用的数量?

我正在编写一个 CUDA 加速的元胞自动机,我希望它以高更新率运行(每秒大约 100k 更新)。有没有办法让连续的 CUDA 调用更快? 我测试过...

回答 1 投票 0

如何在高通智能手机上实现零拷贝?

有哪些方法可以在配备 Qualcomm GPU 的智能手机上启用零复制支持? 我尝试过各种方法。首先,我通过

回答 1 投票 0

Ubuntu OpenCL 在双 GPU 设备上找不到 Intel GPU

我正在尝试在旧的 Ubuntu 笔记本电脑上编写 opencl C++ 应用程序。它有两个 GPU,当我运行 lspci | 时会显示它们。 grep VGA: 00:02.0 VGA 兼容控制器:英特尔公司第三代酷睿

回答 1 投票 0

OpenMP 5 使用成员函数和数据指针卸载 C++ 结构

我在过去的许多项目中都使用过 OpenMP。另外,我还在一些开源项目中编写了 CUDA 和 OpenCL GPU 代码。 我经常听说 OpenMP 5 添加了对 NV 的支持...

回答 1 投票 0

运行时错误:无法设置 version_counter 进行推理 - 在 AMD 的 AI 项目中尝试 DirectML

实际上正在使用 DirectML 转换 PyTorch CUDA 项目(https://github.com/suno-ai/bark)以使用我的 AMD GPU RX6700xt,我遇到问题 RuntimeError: Cannot set version_counter for infe...

回答 2 投票 0

PyCUDA |共享矩阵相乘 |不直观的错误

我看到一个无法解释的错误。 我编写了一个简单的矩阵乘法内核,它执行以下优化: 合并全局内存访问 共享内存加载于

回答 1 投票 0

使用 cudf 进行多线程

我想在 GPU 上生成多个线程。就像我附加的代码片段一样。这样做会引发错误 MemoryError: std::bad_alloc: CUDA error at: rapids/include/rmm/mr/device/

回答 1 投票 0

带有 CUDA 后端的自定义向量类

我一直在自学CUDA,我想做的一个项目是实现一个线性代数库。我用 C++ 创建了一个数学向量类,它通过 GPU 计算点积......

回答 1 投票 0

JAX 的 Bazel 构建因缺少依赖项声明而失败

我正在尝试在 CentOS 版本 7 的集群上从源代码构建支持 cuda 的 JAX。在 jax 主目录中,我运行: python build/build.py --enable_cuda --cuda_path=$CUDA_HOME --cudnn_path=$CUDNN_HO...

回答 1 投票 0

CUDA编译器是否根据传递的参数优化内核?

我有一个简单的 CUDA 内核,可以计算 1000 字节片段中 A 的数量 一个非常大的字符串。数据库的布局使得内存访问 合并。从核心回来后...

回答 1 投票 0

我应该为 vulkan 使用 1 个队列还是 4 个单独的队列?

我正在学习如何使用 vulkan,并且想知道是否使用通用队列系列来完成我的所有任务或使用 4 个单独的队列会更好。 这些是我的 GPU 上的队列系列: ...

回答 1 投票 0

游戏偏好(CPU VS GPU)

我有一台配备 nvidia gt520 2 GB ddr2 显卡和 Intel Core 2 Duo 处理器和 6 GB RAM 的电脑 玩刺客信条枭雄的时候 在图形设置中,它只需要 1850 mb 的 VRAM,尽管...

回答 1 投票 0

Tensorflow 中的多 GPU 训练在 Nans 中得到结果

我正在尝试使用多个GPU进行训练,但是几步之后损失总是Nan。如果我使用单个 GPU,那就没问题了。下面显示了一个虚拟脚本,经过几个步骤后会产生 nan....

回答 1 投票 0

Warp 将原语减少为共享相同值的线程

我面临着减少共享相同变量内容的线程中的值的问题。 更具体地说,为了避免对我正在评估的数组进行原子添加操作

回答 1 投票 0

如何将OpenCL内核编译成比特流?

如何将 OpenCL 内核编译成比特流,以便以后可以直接加载而无需重新编译? 我的平台是AMD机器,同时具有APU和AMD的独立GPU。该机器正在运行最新的 AMD...

回答 1 投票 0

使用 WSL 2 的 Windows 11 上的 Docker for Desktop 的 Kubernetes 对 GPU 支持

我正在使用最新版本的 Docker Desktop,并通过 WSL 2 在 Windows 11 上启用了 Kubernetes。我的笔记本电脑配有 NVidia GPU RTX 3080 ti。 GPU 可用于开箱即用的 Docker(请参阅清单...

回答 1 投票 0

在 Fedora 40 上安装“tensorflow[and-cuda]”

我尝试通过 python3 -m pip install 'tensorflow[and-cuda]' 将tensorflow和CUDA一起安装,但似乎出了问题。不幸的是,我不明白我做错了什么。我...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.