nvidia 相关问题

一家美国全球科技公司,总部位于加利福尼亚州圣克拉拉,以其图形处理器(GPU)而闻名。

用户警告:计划因 cudnnException 失败:CUDNN_BACKEND_EXECUTION_PLAN_DESCRIPTOR

我正在尝试用 Yolov8 训练模型。一切都很好,但今天我突然注意到这个警告显然与 PyTorch 和 cuDNN 有关。尽管有警告,但培训似乎是

回答 2 投票 0

GPU线程占用率和同步停顿有什么关系?

我正在编写一个 CUDA 内核,其内部循环大致如下所示: 对于 (int i = 0; i < NUM_ITERATIONS; i++) { // read global memory, write shared memory __syncthreads(); // read s...

回答 1 投票 0

DPDK 21.11.3,mlx connectX-5 存在巨型帧数据包问题

我正在使用 Mellanox connectX-5 100G NIC 来运行具有 IPV4 巨型帧 9000 字节的应用程序。 我能够发送巨型帧数据包,但无法在 RX 端接收巨型帧数据包。我是

回答 1 投票 0

GradScaler 是否需要使用 pytorch 进行混合精度训练?

所以转到 AMP:普通网络的自动混合精度训练教程,我发现有两个版本:Automatic 和 GradScaler。我只是想知道这是否可取/必要...

回答 2 投票 0

无法获取 CUDA 设备计数,GPU 指标将不可用,docker 中的 Nvidia triton 服务器问题

我正在尝试通过docker运行nvidia推理服务器 我从 docker 获得了 triton 服务器的正确图像 但是当 docker 记录 Sample-tis-22.04 --tail 40 时 它显示了这一点: I0610 15:59:37.597914 1

回答 1 投票 0

在一个 GPU 上运行多个 CUDA 应用程序

CUDA文档没有具体说明多少个CUDA进程可以共享一个GPU。例如,如果我在系统中只安装了一张 GPU 卡的情况下,由同一用户启动多个 CUDA 程序,我会...

回答 4 投票 0

VSCode 在 ubuntu22.04 中启动后 1 秒内不断崩溃

我的 vscode 在启动后 1 秒内突然开始崩溃。 VS代码版本:1.90.0 操作系统版本:Ubuntu 22.04 运行代码 --disable-gpu --disable-extensions --verbose 我试过了: 正在重新安装 V...

回答 1 投票 0

如何在Python上使用yolov8模型文件导出的ONNX

我从YOLOV8导出了onxx格式的模型,但是当我运行时推理不起作用 !yolo 导出模型 =“/content/runs/detect/train/weights/best.pt” format=onnx imgsz=[640,480] 我的问题...

回答 1 投票 0

在 Ubuntu 23.10、RTX 3080ti 中进行 CUDA 训练期间频繁冻结

我是一位致力于深度学习模型的初创公司创始人。与过去几周相比, 在整个训练过程中,我经历过频繁的卡顿。系统死机,通常无法恢复...

回答 1 投票 0

带有 Python 后端流的 Triton 推理服务器

我正在使用带有 python 后端的 Triton 推理服务器,目前发送单个 grpc 请求,有人知道我们如何使用带有流式传输的 python 后端吗,因为我没有找到任何示例或

回答 1 投票 0

我在conda中使用unsloth时遇到bitsandbytes错误

我正在尝试使用其中一个 Colab 笔记本中提供的代码来微调 Unsloth 的 llama3 模型,但在我的系统上运行代码时遇到了几个问题。 以下是错误...

回答 1 投票 0

带有 CUDA 的 Docker 容器看不到我的 GPU | WSL2 / Ubuntu / Win10 | nvcc 和 nvidia-smi 工作

由于某种原因,任何带有 CUDA 的 docker 容器都看不到我的 GPU。 当我运行这个时: docker run --gpus=all --rm nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark 我有这个输出: ... 呃...

回答 1 投票 0

是否可以手动设置用于一个 CUDA 流的 SM?

默认情况下,内核将使用设备的所有可用 SM(如果有足够的块)。然而,现在我有 2 个流,其中一个是计算密集型的,一个是内存密集型的,我想限制最大值...

回答 2 投票 0

我应该在 Google Cloud Platform (GCP) 上使用哪种 GPU

现在,我正在写硕士论文,需要在 GCP 上训练一个巨大的 Transformer 模型。而训练深度学习模型最快的方法就是使用 GPU。所以,我想知道应该使用哪个 GPU...

回答 3 投票 0

Vulkan:动态渲染图像过渡

我正在将渲染器从渲染通道移至动态渲染,并在 Linux(具体是 Nvidia 550.78)上看到验证消息,而在 Windows(具体是 AMD 24.3.1)上却看不到。 ...

回答 1 投票 0

‘CPUDispatcher’对象不可下标错误

我正在尝试处理一个非常大的 csv 文件。 csv 文件 (companies.csv) 包含公司列表,其中包含邮政编码列和其他一些列。我有包含

回答 1 投票 0

如何在Python中获取每秒的GPU使用率

我有一个由tensorflow-gpu运行的模型,我的设备是nvidia。我想列出每秒的 GPU 使用情况,以便可以测量平均/最大 GPU 使用情况。我可以通过打开两个...

回答 4 投票 0

如何同步位于同一块但在 cuda c/c++ 中执行不同操作的线程?

我是一名四年级大学生,正在从事并行计算课程项目。我在选择正确的算法来展示 GPU 性能比较方面做出了一个非常错误的决定...

回答 1 投票 0

错误:Torch 未在启用 CUDA 的情况下编译

当我运行“torch.rand(10).to(“cuda”)”时,我遇到“错误:Torch 未在启用 CUDA 的情况下编译” GPU:Nvidia RTX 3080 Ti $nvidia-smi +------------------------------------------------...

回答 2 投票 0

如何在 NVIDIA P100 上启用 WDDM?

我们有配备 Windows Server 2019 和 NVIDIA P100 的机器。当我们安装官方驱动程序时,我们会进入TCC模式。对于我们的应用程序,我们需要 DirectX,但是当我们尝试使用 nvidia-smi 工具启用 WDDM 时,...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.