与矩阵乘法有关的问题,尤其是实现。数学问题应该考虑线性代数标签。
我正在尝试在Python中计算以下操作:(AB).C,其中A、B、C是稀疏矩阵,并且带有下面的点“.” 我指出了矩阵的 Hadamard(逐项)乘积,...
我努力编写了一个用于矩形矩阵乘法的C程序,但是当编译并运行该程序时,结果矩阵并没有随乘积一起打印。作为用户输入,我尝试了
我努力编写了一个用于矩形矩阵乘法的C程序,但是当编译并运行该程序时,结果矩阵并没有随乘积一起打印。作为用户输入,我尝试了
使用 numpy,我可以像这样进行简单的矩阵乘法: a = numpy.ones((3, 2)) b = numpy.ones((2, 1)) 结果 = a.dot(b) 但是,这不适用于 PyTorch: a = 火炬.ones((3, 2)) b = ...
使用 numpy,我可以像这样进行简单的矩阵乘法: a = numpy.ones((3, 2)) b = numpy.ones((2, 1)) 结果 = a.dot(b) 但是,这不适用于 PyTorch: a = 火炬.ones((3, 2)) b = ...
我发现 Rmpfr 中的外部与代表后的向量乘法相比非常慢。我尝试过 external、%*% 和 tcrossprod。 图书馆(Rmpfr) 米 <- 100 n <- 50 x <- mpfr(runif(m), 128) y &l...
我正在开发一个项目,我必须在(广播)矩阵乘法之前执行一些行和/或列排列。虽然 numpy 的实现很简单,但我注意到
我试图将 R 中两个向量之间的角度中两个向量之间角度的计算推广到查找矩阵 X 的所有列之间或 X 和
考虑以下代码: 设置.种子(1) <- 30 X <- rnorm(n, mean = 0, sd = 1) Z <- rnorm(n, mean = 0, sd = 1) A <- rnorm(n, mean = 0, sd = 1) W <- 4*X + 8*Z B <- 6*X + 9*Z +...
为什么我的矩阵乘法程序(在 CUDA 中)适用于整数 1 <= K <= 256 and when K = 512, but not when 256 < K < 512?
在下面的实现中(在 CUDA 中),我有一个矩阵乘法器,使用经典方法获取矩阵 A 的行和矩阵 B_T(已转置)列的点积,其中 res...
我正在开发一个网络应用程序,它将能够进行一些图像转换,其中之一是图像旋转,问题是:只要画布是正方形(宽度=高度),一切都可以,但是......
我正在编写一段代码,根据飞机的方向和全局速度矢量来计算飞机的迎角和侧滑角。我的所有数据都保存在数据框中。至
我有一个形状为(M,L,N,N)的NumPy数组ar。 我想连续乘以 L (N, N) 矩阵 (multiplied_ar[m] = ar[m, 0, :, :] @ ar[m, 1, :, :] @ ...) 得到一个数组形状(M,N,N)。 我...
我有一个向量,其中元素被分配为 1 或 0 例如 V1 <- c(1,0,1,1,0) I want to generate a matrix M of size V1 x V1 in which each element is coded 1 if the values of the
下面是 AVX2 中矩阵乘法的实现。我使用的机器仅支持 AVX,因此我尝试使用 AVX 实现相同的配置。 然而,我在破译方面遇到了困难
我希望找到一种方法来将元素包含多项式表达式的矩阵(与其他矩阵和向量)相乘并获得多项式格式的最终结果。 我有一个 10 x 10 ...
我已经使用 GPU 一段时间了,没有质疑它,但现在我很好奇。 为什么GPU做矩阵乘法比CPU快很多?是因为并行处理吗?但我什么也没写
如何在 OpenCV 中的 CV_32FC1 和 CV_32FC3 图像之间进行像素级乘法
我正在使用 OpenCV 在 2 维图像 A(CV_32FC1)与另一个 3 维图像 B(CV_32FC3)之间进行像素级乘法,即 imageA 与 imageB 的每个 R\G\B 通道进行像素级乘法。 ...
为什么Eigen库中double的计算速度比float快3倍?
这是我的代码。我使用 double 类型创建了一组矩阵和向量乘法,并使用 float 类型创建了另一组。两组乘法在 for 循环中执行了 300 万次,a...
考虑以下矩阵乘法内核: __global__ void mmNaive(int numArows, int numBCols, int Width, float** A, float** B, float* C) { int tx = threadIdx.x; int ty = threadIdx.y; ...