vectorization 相关问题

矢量化是指一种编程范例,其中函数一次性在整个数组上运行。这在函数调用,存储器访问,并行化和代码表达方面提供了好处。某些编程语言(如MATLAB)经过优化,可在向量化时提供最佳性能。


有一种聪明的方法来矢量化嵌套的循环,其中内部索引受外部索引限制?

是否有一种智能的方式将嵌套的内部产品循环矢量化,其中内部索引由外部索引下降? 这是一个简单的例子。说arr1和arr2是每个numpy数组

回答 0 投票 0

如何编写向量函数以应用F(x,y)操作?

Scalar_Function只能处理标量输入,我们可以使用函数np.vectorize()将其转换为矢量化函数。请注意,NP.Dectorize()的输入参数应该是标量函数...

回答 3 投票 0


用GCC来实现自动矢量化?

在评估负面类似的背景下,我必须 执行一堆可以从矢量化中受益的操作: for(i = 1 ... n){a [i] = 0; } //但是我认为 std :: fill(a ...

回答 2 投票 0

#include

#include <iostream> #include <numeric> int main() { volatile float a0[4] = {1, 2, 3, 4}, a1[4] = {4, 5, 6, 7}; std::cout << std::inner_product(a0, a0 + 4, a1, 0.0F) << std::endl; return 0; } << std::

回答 1 投票 0




编译器对循环进行向量化

我有一个非常基本的问题,涉及编译器(在我的例子中为 gcc)使用 -O 标志进行的优化。我想在这里只关注循环的矢量化。假设一个简单的 for 循环,没有...

回答 1 投票 0

如何在 MATLAB 中将矩阵划分为 N^2 个段,每个段包含 NxN 个元素?

假设我们有一个大小为 N^2 x N^2 个元素(例如 9x9)的矩阵 M,将其分成 3x3 段(每个段有 3x3 个元素)的最快方法是什么。 我想到的一种方法如下: 米 =

回答 1 投票 0

如何矢量化 Pandas DateTimeIndex

我试图避免使用 DateTimeIndex 的 for 循环。我有一个函数 get_latest 可以查找最新的工资指数值。当我遍历发薪日的日期时,查找工作正常。什...

回答 1 投票 0

向量化三个嵌套循环,计算每小时数据的日均值

有没有办法对下面的三嵌套循环进行向量化,计算每小时数据的日均值?下面的函数首先循环一年,然后循环几个月,最后循环几天。它还...

回答 1 投票 0

Python:最小化关于第 i 个变量的函数

我有一个函数 func(x) ,其中参数是长度为 n 的向量。我想最小化 x 的第 i 个分量,同时保持其他分量固定。因此将其表示为

回答 1 投票 0

numpy.linalg.tensorsolve 中的向量化

我正在尝试解方程: 斧头 = B 对于 x,其中 A 和 B 是形状为 (3, 3, 3, 3) 和 (3, 3) 的矩阵。这可以使用 numpy.linalg.tensorsolve() 来处理: numpy.linalg.tensorsolve(A, B, 斧头...

回答 2 投票 0

ARM NEON 矢量化失败

我想在 ARM cortex-a9 上启用 NEON 矢量化,但在编译时得到以下输出: “未矢量化:不支持相关 stmt:D.14140_82 = D.14143_77 * D.14141_81” 这是我的厕所...

回答 2 投票 0

如何在Python中从具有两个起始和两个停止一维数组的较大数组中提取子数组?

我正在寻找一种方法来矢量化以下代码, # 让立方体具有形状 (N, M, M) sub_arrays = np.empty(len(cube), 3, 3) row_start = ... # 形状 (N,) 且是 [0, M-2] 范围内的整数 行_e...

回答 1 投票 0

缩小徽标 - Photoshop

我有一个由自由职业者制作的徽标。起初,这个标志看起来很棒,我很高兴。但现在我开始使用不同尺寸的徽标,问题就开始了。 我使用的自由职业者没有

回答 3 投票 0

AVX2 / gcc:通过使用不同的寄存器来提高CPU级并行性

我有这个代码: __attribute__((目标(“avx2”))) size_t lower_than_16(const uint64_t 值[16], uint64_t x) { __m256i vx = _mm256_set1_epi64x(x); __m256i vvals1 = _mm256_loadu_s...

回答 1 投票 0

如何加速pandas字符串函数?为什么 .str 比 .apply(lambda) 慢?

我正在使用 pandas 矢量化 str.split() 方法来提取从“~”上的拆分返回的第一个元素。 我也尝试过使用 df.apply() 与 lambda 和 str.split() 来pr...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.