micro-optimization 相关问题

微优化是对小部分代码进行细致调整的过程，以解决其操作的某些方面（内存使用过多，性能不佳等）的感知缺陷。

如何在 Rust 中自动向量化 (SIMD) 模乘法

我正在尝试优化具有模乘法的代码，以使用 SIMD 自动矢量化。也就是说，我不想使用任何库，编译器应该完成这项工作。这是小验证...

rust simd micro-optimization auto-vectorization

回答 1 投票 0

DateTime.DayOfWeek 微优化

首先：我问这个问题只是为了好玩和渴望学习。我不得不承认我喜欢搞一些微观优化（尽管它们从未导致......

c# performance datetime micro-optimization dayofweek

回答 2 投票 0

无需内联汇编即可生成 FMOV

我想要：将 64 位值从 GPR 移至向量寄存器的低 64 位执行操作（特别是 bdep 或 beext）将向量寄存器的低 64 位移至 GPR 这不...

clang simd arm64 micro-optimization sve

回答 1 投票 0

在 ?: 运算符上分支？

对于现代硬件上的典型现代编译器，会吗？ : 运算符结果会影响指令管道的分支吗？换句话说，哪个更快，调用这两种情况以避免 poss...

c++ hardware micro-optimization

回答 5 投票 0

如何有效地使用SIMD来统计大型单词搜索网格（包括垂直和对角线）中的4个字符匹配？

在 2024 年代码出现的第 4 天，存在一个问题，您需要查找字符网格中包含多少个“XMAS”字符串，例如 MMMSXXMASM MSAMXMSMSA AMXSXMAAMM 玛萨玛斯...

c++ optimization simd micro-optimization

回答 1 投票 0

SIMD shuffle 可以将哪些执行端口用于 AVX2 和 NEON？

在查看英特尔优化参考手册时，我注意到以下部分：处理端口 5 压力。它基本上表示 Sandy Bridge 微架构中的端口 5 包括随机播放单元，这些单元的频率...

cpu-architecture simd avx neon micro-optimization

回答 1 投票 0

SIMD 指令可以用于 AVX2 和 NEON 的哪些执行端口？

在查看英特尔优化参考手册时，我注意到以下部分：处理端口 5 压力。它基本上表示 Sandy Bridge 微架构中的端口 5 包括随机播放单元，这些单元的频率...

cpu-architecture simd avx neon micro-optimization

回答 1 投票 0

为什么 clang 的 `-O3` 分配在简单的分配基准上比 g++ 快 2 倍

关于alloca的使用和滥用在上一个问题的底部得到了一些基准。 clang 显然在 -O3 优化器配置文件中有更好的实现。什么给？是叮当切割任何cor...

memory-management clang compiler-optimization micro-optimization alloca

回答 1 投票 0

为什么 clang 的 `-O3` 分配比 g++ 快 2 倍

关于alloca的使用和滥用在上一个问题的底部得到了一些基准。 clang 显然在 -O3 优化器配置文件中有更好的实现。什么给？叮叮当切任何c...

memory-management clang compiler-optimization micro-optimization

回答 1 投票 0

为什么 GCC 不能为两个 int32 的结构生成最佳运算符 == ？

一位同事向我展示了我认为没有必要的代码，但果然是这样。我希望大多数编译器会将所有这三种相等测试尝试视为等效： #包括...

c++ gcc x86-64 compiler-optimization micro-optimization

回答 3 投票 0

在 C 源代码中保留带有分支布局的执行管道？ CPU 或编译器从哪个预测开始？ [重复]

经常检查返回类型是否有错误。但是，可以用不同的方式指定将继续执行的代码。如果（！ret） { doNoErrorCode(); } 退出（1）；或者如果（返回） { 退出（1）； }

c cpu-architecture compiler-optimization micro-optimization branch-prediction

回答 2 投票 0

保留执行管道

经常检查返回类型是否有错误。但是，可以用不同的方式指定将继续执行的代码。如果（！ret） { doNoErrorCode(); } 退出（1）；或者如果（返回） { 退出（1）； }

c cpu-architecture micro-optimization

回答 2 投票 0

手臂组件中的popcount，没有霓虹灯

我已经阅读了这篇文章以及维基百科我知道下面的代码应该在 asm 中产生 12 条指令。 i = i - ((i >> 1) & 0x55555555); // 添加位对我 = (我 & 0x333...

assembly arm micro-optimization hammingweight

回答 3 投票 0

Python 中异常处理程序的成本

在另一个问题中，已接受的答案建议用 try/ except 块替换 Python 代码中的（非常便宜的）if 语句，以提高性能。抛开编码风格问题不谈，并假设......

python performance exception micro-optimization

回答 5 投票 0

在 C 中*有效*提取 double 的小数部分

我希望采用 IEEE double 并以最有效的方式删除它的任何整数部分。我想 1035 ->0 1045.23->0.23 253e-23=253e-23 我不关心正确处理...

c floating-point double micro-optimization bit-manipulation

回答 7 投票 0

为什么我的运算符 ++ 比其等效实例方法快两倍以上？

我正在 .NET 8 上针对以下代码运行 BenchmarkDotNet：使用 System.Runtime.InteropServices；使用 BenchmarkDotNet.Attributes；使用 BenchmarkDotNet.Running； [StructLayout(LayoutKind.Ex...

c# .net-core micro-optimization benchmarkdotnet

回答 1 投票 0

网格中一个点与所有其他点之间距离的最佳算法

在像素网格中，我希望计算从一个选定像素到所有其他像素的欧几里德距离。这也可以被认为是找到二维中一点之间的欧几里德距离......

algorithm geometry coordinates discrete-mathematics micro-optimization

回答 2 投票 0

在rigtorp的SPSCQueue中使用索引缓存的目的是什么

我正在阅读rigtorp的SPSCQueue的实现，这是一个非常优雅的设计并且具有非常好的基准。我理解自述文件中描述的大部分设计哲学。我什么...

queue cpu-architecture cpu-cache micro-optimization lock-free

回答 2 投票 0

现在在 x86-64 上还值得使用 Quake 快速逆平方根算法吗？

具体来说，这是我正在谈论的代码：浮点 InvSqrt(浮点 x) { 浮点数 xhalf = 0.5f*x; int i = *(int*)&x; // 警告：严格别名 UB，请使用 memcpy 代替我 = 0x5f375a8...

algorithm optimization x86-64 micro-optimization sqrt

回答 1 投票 0

局部变量与数组访问的性能

我正在对 Perl 性能进行一些基准测试，并遇到了一个我认为有些奇怪的情况。假设您有一个多次使用数组中的值的函数。在这种情况下，你

performance benchmarking micro-optimization perl

回答 2 投票 0

最新问题

© www.soinside.com 2019 - 2025. All rights reserved.