首先让我解释一下我将概述的问题的动机。我有一个无符号字的向量v
,信息存储在位中,以及一些可能不同的无符号类型的字w
。我想把len
的v
位放到w
,从i
的w
th LSB开始。例如,考虑下面的情况,我将这些单词表示为位只是为了解释。
T1 w = 10110100;
vector<T2> v = [11, 00, 10, 01];
T1 len = 5;
T1 start = 2;
T1 dst_digits = 8;
T1 src_digits = 2;
10110100 -> 10111100 -> 10001100 -> 11001100
很明显,我们需要迭代v
并一次向w
添加一个字。一种方法是这样做
template<class T>
T _blend(T a, T b, T start, T len) {
// Replaces len bits of a by the ones of b starting at start
}
auto it = std::begin(v);
while (len > 0) {
w = _blend(w,
(T1) ((T1) *first) << start),
start,
std::min(len, src_digits)
);
start += std::min(len, src_digits);
++first;
len -= std::min(len, src_digits);
}
我是C ++的新手,上面的代码是简化的代码,但主要的想法是站立的。我现在也有这个工作。但是,我发现(T1) ((T1) *first) << start)
丑陋。但是,如果我不包括第一个演员,那么移位操作将被提升为int
或long
,然后与其他类型的_blend
不匹配。如果我不包括第二个演员,我可能overshift *first
(在dst_digits > src_digits
和start > src_digits
的情况下)。
现在,我的问题是两次(T1)
转换成本有多高?我的猜测并不像其他东西那样昂贵,比如std::min
调用或循环中的其他语句。我只是因为来自Python,只是看起来像(T1) ((T1) *first) << start)
看起来很不自然,我想知道这是否只是C ++的结果,几乎没有开销,以及是否有更好的方法来做到这一点。
在little-endian系统上,无符号整数到无符号整数转换为零或一条指令。
如果在uint64
有一个rax
,那么投射到uint32
基本上是无操作。编译器将假设该值在eax
(rax
的最不重要的一半)中。
如果在uint32
中有一个eax
,那么投射到uint64
只是一个非常快速的指令。编译器将eax
中的值零扩展(用零填充最重要的部分),并使用rbx
指令将结果放在movzx
中。
在此操作期间,无符号整数强制转换是您最不关心的问题。你可能想考虑使用std::vector<bool>
或std::bitset
,因为他们会为你做这一点。