Thrust 有算法:
这对于我的一个问题来说可以很好地协同工作。我想尝试使用 CUB 来更好地控制内存和流以及与我自己的内核交互,但 CUB 中似乎没有
reduce_by_key
等效项。有DeviceSegmentedReduce
,但它似乎没有输出按键顺序,我需要事先找到每个连续按键段的开始,这是它自己的问题。
问题是将键值对数组缩减为一个数组,其中所有键都是唯一的,并且每个值都有所有相同键值的缩减。
有没有一种我没有看到的简单方法可以用 CUB 来做到这一点?
cub::DeviceReduce::ReduceByKey
。由于某种原因,它被归类为减少而不是分段减少,这令人困惑。