cublas 相关问题

NVIDIA CUDA基本线性代数子程序(cuBLAS)库是完整标准BLAS库的GPU加速版本,可与支持CUDA的GPU一起使用。

OSError:未定义符号:cublasLtGetStatusString,版本 libcublasLt.so.11 仅在 tmux 终端中

我在终端中运行一个 shell 脚本,一切正常,但是在进入 tmux 终端,并在相同的 conda 环境中运行相同的脚本后,我得到了这个错误: 操作系统错误:/

回答 0 投票 0

cublas地址超出特定矩阵大小的范围。

当我运行以下代码来计算矩阵乘法y = X * B。#include #include #include #include "cublas_v2.h" using ...

回答 1 投票 0

使用OpenACC和cublasDgemv将g ++与pgi编译的代码链接时出现内存错误

为了在带有g ++的应用程序中将我的GPU与OpenACC和cublas一起使用,我设置了一个小测试示例。为此,我创建了以下文件:main.cpp pgiCudaCode.h pgiCudaCode.cpp我的...

回答 1 投票 0

如何在CUDA中加速saxpy的列表

我有一个矩阵和一个长度为BATCH_SIZE的三元组列表:float matrix [3000] [3000](float向量[3000],uint32_t索引,float alpha)对于每个三元组,我使用以下内容执行一个saxpy:matrix [。 ..

回答 1 投票 -1

为什么这个矩阵乘法慢(Turing GPU)?

根据规格,使用Tensor Core的半精度Nvidia RTX 2080 Ti应该能够达到107.6 TeraFLOPS。但是,在最佳条件下(非常大的矩阵,其大小为...

回答 1 投票 -1

CUDA内核可以调用cublas函数吗?

我知道这听起来很奇怪,但是这是我的情况:我需要做一个矩阵矩阵乘法(A(n * k)* B(k * n)),但是我只需要对角元素进行求值输出矩阵。我搜索了...

回答 3 投票 16

为什么cublas复制算法在cuda中这么快?

我编写了将输入向量复制到输出向量的内核。但是与cublascopy API相比,性能还不够。对于1M个元素,cublasScopy比我的内核快100倍。...

回答 1 投票 0

CUBLAS转置矩阵乘法问题

我正在尝试在CUBLAS中乘以C = At *B。问题是,使用我拥有的代码(从中获取),有些矩阵维度似乎可以正常工作int rows_a = ...

回答 1 投票 0

RTX 2080钛CUDA-MEMCHECK创造CUBLAS上下文开始打错误

我在两个1080 GTX Ti和RTX 2080钛运行同一程序。我发现,当我尝试使用CUDA的MEMCHECK工具来检查我的计划,我根据设备RTX 2080缇总是有以下错误。 == ...

回答 2 投票 0

由于“无效参数”,Cublas编程程序命中了cudaErrorInvalidValue

最近,我尝试用Cublas库编写GPU编程。我所做的只是在设备上分配内存并进行矩阵计算。但是,当我尝试按以下方式分配内存时,我......

回答 1 投票 0

cuBLAS Dgemm产品与python

我有两个简单的矩阵A和B,我正在计算它们的乘法。数组看起来像这样(使用numpy作为模型)A = np.array(([1,2,3],[4,5,6]))。astype(np.float64)B = np.array(( [7,8],[9,...

回答 2 投票 1

Tensorflow:ImportError:libcublas.so.9.0

我安装了Tensorflow。当我尝试导入它时:导入tensorflow因为我得到以下问题:ImportError:libcublas.so.9.0:无法打开共享对象文件:没有这样的文件或目录我有...

回答 2 投票 0

与cublas的tensorflow运行错误

当我在群集上成功安装tensorflow时,我立即运行mnist demo来检查它是否正常,但在这里我想出了一个问题。我不知道这是什么,但看起来......

回答 2 投票 5

无法创建cudnn句柄:CUBLAS_STATUS_ALLOC_FAILED

我正在尝试运行我在GitHub上找到的这个气球分割模型:https://github.com/matterport/Mask_RCNN/tree/master/samples/balloon。它运行在我的linux虚拟机上,但非常非常......

回答 1 投票 1

Cublas - 列/行明智的操作

我正在寻找一种在列上执行操作的方法。我有MxN矩阵,我想在每列上激活cublas函数(例如nrm2)。我期望获得的结果是:M x 1怎么能......

回答 1 投票 0

ImportError:libcublas.so.8.0:无法打开共享对象文件:没有这样的文件或目录(共享Linux)

我是tensorflow的新手,我正在使用共享linux(Ubuntu 16.04),这意味着我没有root访问权限。 Cuda 8.0和Cudnn 8已由管理员以root身份安装。我已经安装了python 3.5 ...

回答 1 投票 3

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.