matrix-multiplication 相关问题

与矩阵乘法有关的问题,尤其是实现。数学问题应该考虑线性代数标签。

使用数组将矩形矩阵相乘的C程序?

我努力编写了一个用于矩形矩阵乘法的C程序,但是当编译并运行该程序时,结果矩阵并没有随乘积一起打印。作为用户输入,我尝试了

回答 1 投票 0

如何在 PyTorch 中进行矩阵相乘?

使用 numpy,我可以像这样进行简单的矩阵乘法: a = numpy.ones((3, 2)) b = numpy.ones((2, 1)) 结果 = a.dot(b) 但是,这不适用于 PyTorch: a = 火炬.ones((3, 2)) b = ...

回答 5 投票 0

如何在 PyTorch 中进行矩阵乘法?

使用 numpy,我可以像这样进行简单的矩阵乘法: a = numpy.ones((3, 2)) b = numpy.ones((2, 1)) 结果 = a.dot(b) 但是,这不适用于 PyTorch: a = 火炬.ones((3, 2)) b = ...

回答 5 投票 0

“Rmpfr”中的慢速“outer”

我发现 Rmpfr 中的外部与代表后的向量乘法相比非常慢。我尝试过 external、%*% 和 tcrossprod。 图书馆(Rmpfr) 米 <- 100 n <- 50 x <- mpfr(runif(m), 128) y &l...

回答 1 投票 0

涉及 numpy 中整数数组索引数组的矩阵乘法的性能下降

我正在开发一个项目,我必须在(广播)矩阵乘法之前执行一些行和/或列排列。虽然 numpy 的实现很简单,但我注意到

回答 1 投票 0

求 R 中矩阵列之间的角度

我试图将 R 中两个向量之间的角度中两个向量之间角度的计算推广到查找矩阵 X 的所有列之间或 X 和

回答 1 投票 0

R 中的 QR 分解不正确?

考虑以下代码: 设置.种子(1) <- 30 X <- rnorm(n, mean = 0, sd = 1) Z <- rnorm(n, mean = 0, sd = 1) A <- rnorm(n, mean = 0, sd = 1) W <- 4*X + 8*Z B <- 6*X + 9*Z +...

回答 1 投票 0

为什么我的矩阵乘法程序(在 CUDA 中)适用于整数 1 <= K <= 256 and when K = 512, but not when 256 < K < 512?

在下面的实现中(在 CUDA 中),我有一个矩阵乘法器,使用经典方法获取矩阵 A 的行和矩阵 B_T(已转置)列的点积,其中 res...

回答 1 投票 0

在宽画布中使用 webGL 旋转图像

我正在开发一个网络应用程序,它将能够进行一些图像转换,其中之一是图像旋转,问题是:只要画布是正方形(宽度=高度),一切都可以,但是......

回答 1 投票 0

优化数据帧列的大量矩阵乘法

我正在编写一段代码,根据飞机的方向和全局速度矢量来计算飞机的迎角和侧滑角。我的所有数据都保存在数据框中。至

回答 1 投票 0

NumPy 连续矩阵乘法向量化

我有一个形状为(M,L,N,N)的NumPy数组ar。 我想连续乘以 L (N, N) 矩阵 (multiplied_ar[m] = ar[m, 0, :, :] @ ar[m, 1, :, :] @ ...) 得到一个数组形状(M,N,N)。 我...

回答 1 投票 0

如何生成一个矩阵来显示向量中的元素对是否相等

我有一个向量,其中元素被分配为 1 或 0 例如 V1 <- c(1,0,1,1,0) I want to generate a matrix M of size V1 x V1 in which each element is coded 1 if the values of the

回答 1 投票 0

AVX 和 AVX2 之间的区别

下面是 AVX2 中矩阵乘法的实现。我使用的机器仅支持 AVX,因此我尝试使用 AVX 实现相同的配置。 然而,我在破译方面遇到了困难

回答 1 投票 0

Python 上的矩阵乘法求多项式

我希望找到一种方法来将元素包含多项式表达式的矩阵(与其他矩阵和向量)相乘并获得多项式格式的最终结果。 我有一个 10 x 10 ...

回答 1 投票 0

为什么GPU做矩阵乘法比CPU更快?

我已经使用 GPU 一段时间了,没有质疑它,但现在我很好奇。 为什么GPU做矩阵乘法比CPU快很多?是因为并行处理吗?但我什么也没写

回答 4 投票 0

如何在 OpenCV 中的 CV_32FC1 和 CV_32FC3 图像之间进行像素级乘法

我正在使用 OpenCV 在 2 维图像 A(CV_32FC1)与另一个 3 维图像 B(CV_32FC3)之间进行像素级乘法,即 imageA 与 imageB 的每个 R\G\B 通道进行像素级乘法。 ...

回答 3 投票 0

为什么Eigen库中double的计算速度比float快3倍?

这是我的代码。我使用 double 类型创建了一组矩阵和向量乘法,并使用 float 类型创建了另一组。两组乘法在 for 循环中执行了 300 万次,a...

回答 1 投票 0

朴素矩阵乘法的 CUDA 内存访问分析混乱

考虑以下矩阵乘法内核: __global__ void mmNaive(int numArows, int numBCols, int Width, float** A, float** B, float* C) { int tx = threadIdx.x; int ty = threadIdx.y; ...

回答 1 投票 0

numpy.dot函数和手动计算

我正在手工从雅可比矩阵计算 pcov,并理解其中的大部分内容,但我很难理解 .dot 函数如何在 python 中的 numpy 中工作。我看过那个男人...

回答 1 投票 0

高效实现一系列矩阵-向量乘积/特定“张量”-矩阵乘积

我有一个特殊的算法,作为最后的步骤之一,我需要执行 3-D 数组与 2-D 数组的乘法,以便 3-D 数组的每个矩阵切片相乘,其中每个

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.