gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息，请参阅“图形编程”的标记条目。对于使用GPU的通用编程，请参阅“gpgpu”的标记条目。对于特定的GPU编程技术，请参阅“opencl”，“cuda”和“thrust”的热门标签条目。

python cuda gpu google-colaboratory triton

回答 0 投票 0

为什么此CUDA代码循环无限期？

以下代码无限期地运行，因为kernel_loop被困在无限循环中。两个小内核是否同时推出？ #include #include<

c++ cuda gpu

回答 1 投票 0

为什么这个cuda循环无限期？

以下代码无限期地运行，因为kernel_loop被困在无限循环中。两个小内核是否同时推出？ #include #include<

c++ cuda gpu

回答 1 投票 0

android本地内存与GPU内存

android gpu heap

回答 1 投票 0

TENSORFLOW模型。预测使用越来越多的内存

from_generator

tensorflow gpu out-of-memory

回答 1 投票 0

torch.cuda.OUTOfMemoryError：CUDA 内存不足。尝试分配 xxx MiB

这是我使用 pytorch 训练 nerf 模型时遇到的错误，该错误在向后传递过程中显示：回溯（最近一次调用最后一次）：文件“train_dmsr.py”，第 133 行，位于这是我使用 pytorch 训练 nerf 模型时遇到的错误，该错误在向后传递过程中显示： Traceback (most recent call last): File "train_dmsr.py", line 133, in <module> train() File "train_dmsr.py", line 64, in train total_loss.backward() File "/home/sue/anaconda3/envs/DM-NeRF/lib/python3.7/site-packages/torch/_tensor.py", line 489, in backward self, gradient, retain_graph, create_graph, inputs=inputs File "/home/sue/anaconda3/envs/DM-NeRF/lib/python3.7/site-packages/torch/autograd/__init__.py", line 199, in backward allow_unreachable=True, accumulate_grad=True) # Calls into the C++ engine to run the backward pass torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 288.00 MiB (GPU 0; 11.51 GiB total capacity; 9.94 GiB already allocated; 304.25 MiB free; 10.17 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF 我尝试减少批量大小，但错误仍然存在，并且仍然显示相同数量的内存分配（尝试分配 288.00 MiB）。我不确定是否是因为我的GPU（11GB）确实内存不足或者我的GPU内存没有被利用。我还想知道是否应该使用内存更大的 GPU 服务器，或者是否有其他解决方案来解决内存不足错误？如有任何建议，我们将不胜感激！谢谢！我为另一个项目安装cuda 11.7后遇到了同样的问题。我的cuda版本是11.7，但是在Pytorch中，11.8是由pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118安装的。安装正确版本的 cuda 可能会有所帮助。

pytorch gpu out-of-memory

回答 1 投票 0

在 23.67 GiB GPU 上进行 PatchCore 训练时出现 OutOfMemoryError

我正在具有 23.67 GiB 内存的 GPU 上训练图像大小为 128x512 的 PatchCore 模型。但是，我遇到了以下错误： CUDA版本：12.4 PyTorch 版本：2.5.1 内存不足错误：

memory-management pytorch gpu out-of-memory

回答 1 投票 0

Intel Mac 上的 Torch MPS：获取设备名称？

在Python中，在一台具有NVIDIA GPU的机器上，可以使用以下命令确认GPU的mps设备名称： torch.cuda.get_device_name() 根据文档：https://pytorch.org/docs/stable/ generated/torch.cuda。

python gpu torch mps

回答 1 投票 0

重写二进制可执行文件以使用 GPU/多线程？

是否有任何工具可以为我重写二进制文件以使用 GPU、SSE 指令或多线程？我有一个单线程的程序并且有很多空闲周期，但我没有...

multithreading optimization gpu

回答 1 投票 0

是否有任何带有执行器的在线编译器可以编译使用特定于 GPU 的 C/C++ 代码的应用程序？

一般我需要一些在线编译器，可以编译并执行提供的程序并输出执行速度和其他统计数据。所有程序都可以在一个 C 文件中，并且可以使用任何 GPU C/C++ ...

c++ c cuda opencl gpu

回答 4 投票 0

为什么我在GPU上的AI训练比CPU慢很多

我目前正在训练我的简单预测人工智能，但我的 GPU 的训练速度为每轮 40 秒，而我的 CPU 的训练速度为每轮 9 秒我的CPU是i7-4720HQ，GPU是Nvidia 950m 这是我的代码 `导入

machine-learning artificial-intelligence gpu cpu

回答 1 投票 0

tex1Dfetch 意外返回 0

我不认为这与此处报告的问题相同：绑定 CUDA 纹理读取为零 CUDA 1D 纹理获取始终返回 0 在我的 CUDA 应用程序中，我注意到 tex1Dfetch 没有返回

c++ cuda textures gpu

回答 1 投票 0

使用Adreno GPU进行深度学习

我需要使用 Adreno GPU 进行深度学习（TensorFlow、PyTorch）而不是 Nvidia 有谁知道怎么做吗？我正在使用 Python 我该怎么办我真的不知道。我也得到了

python gpu opencl pyopencl

回答 1 投票 0

来自共享内存库的数据广播

我一直在尝试了解数据广播的工作原理。鉴于此，我设计了两个不同的内核（在从共享内存读取数据方面）。我试过比较...

memory cuda gpu

回答 1 投票 0

为cuda 12.6安装pytorch

如何为cuda 12.6安装pytorch？ 12.4 之前可用。但是当我安装12.4时，它就安装了。但它显示 jupyter 笔记本中的内核重新启动问题。请帮忙。你能请苏...

python python-3.x pytorch cuda gpu

回答 1 投票 0

执行并行归约以巩固对矩阵的贡献的最佳方法是什么？

我正在尝试并行计算并将结果合并到矩阵中。执行大量计算，每一项计算都会构成所有结果的总和矩阵。 ...

c++ algorithm parallel-processing gpu reduction

回答 1 投票 0

OpenGL/DirectX 上的硬件超高分辨率视频解码和渲染

我正在尝试解码和渲染超高分辨率视频（4k x 4k），并且视频使用 h.264 编解码器进行编码。在解码视频帧时，我们希望在着色器上渲染帧，当前...

opengl directx gpu directshow video-processing

回答 2 投票 0

CUDA __global__ 函数中的 printf

我目前正在 GPU 上编写矩阵乘法，并想调试我的代码，但由于我无法在设备函数中使用 printf，我还能做些什么来查看 goi 是什么...

c++ c cuda gpu

回答 5 投票 0

如何使用 CUDA C++ 将内存从 CPU 复制到 GPU？

我想使用 GPU 而不是 cpu 进行线程处理，但我不太确定该怎么做。我尝试做这样的事情： int data_array = readfile(); int array_size = data_array.size(); int iter...

c++ cuda gpu

回答 1 投票 0

CUBLAS gemm 结果与 1e-3 阶的朴素矩阵乘法略有不匹配，预计会更少

我是CUDA新手，我认为练习CUDA编程的最好方法是编写一个简单的矩阵乘法程序并逐步优化它。但我在第一步就遇到了挑战。我的...

cuda gpu gpgpu

回答 1 投票 0

最新问题

© www.soinside.com 2019 - 2025. All rights reserved.