在查看 Clang 和 g++ C++11 实现状态时,我注意到一些奇怪的事情:
它们支持 C++11 原子,但不支持 C++11 内存模型。
我的印象是你必须有 C++11 内存模型才能使用原子。
那么对原子和内存模型的支持到底有什么区别?
缺乏内存模型支持是否意味着使用
std::atomic<T>
的合法 C++11 程序的 seq 不一致?
参考资料:
http://clang.llvm.org/cxx_status.html
http://gcc.gnu.org/gcc-4.7/cxx0x_status.html
问题之一是“内存位置”的定义,它允许(并强制编译器支持)通过不同的锁锁定不同的结构成员。有一个关于由此引起的 RL 问题的讨论。
基本上问题在于
struct
的定义如下:
struct x {
long a;
unsigned int b1;
unsigned int b2:1;
};
编译器也可以通过覆盖
b2
来自由地实现对 b1
的写入(显然,从报告来看,确实如此)。因此,这两个字段必须被锁定为一个。然而,由于 C++11 内存模型,这是被禁止的(好吧,并不是真的禁止,但编译器必须确保同时更新 b1
和 b2
不会干扰;它可以通过锁定或对每个这样的更新进行 CAS 处理,好吧,在某些架构上生活很困难)。引用报告:
我向我们的 GCC 人员提出了这个问题,他们对我说:“C 确实 不提供这样的保证,也不能可靠地锁定不同的 如果它们共享自然对齐,则具有不同锁的结构字段 字大小的存储区域。 C++11 内存模型将保证这一点, 但这还没有实现,您也没有使用 C++11 构建内核 编译器。”
也可以在 wiki 中找到不错的信息。
我猜这些情况下的“缺乏内存模型”仅意味着优化器是在 C++11 内存模型发布之前编写的,并且现在可能执行无效的优化。验证内存模型的优化非常困难且耗时,因此 clang/gcc 团队尚未完成这一工作也就不足为奇了。
缺乏内存模型支持是否意味着使用 std::atomic 的合法 C++11 程序的 seq 不一致?
是的,这是有可能的。更糟糕的是:编译器可能会将数据竞争引入(根据 C++11 标准)无竞争程序,例如通过引入推测写入。
例如,几个C++编译器用于执行此优化:
for (p = q; p = p -> next; ++p) {
if (p -> data > 0) ++count;
}
可以优化为:
register int r1 = count;
for (p = q; p = p -> next; ++p) {
if (p -> data > 0) ++r1;
}
count = r1;
如果所有
p->data
均为非负数,则原始源代码不会写入count
,但优化后的代码会写入。这可能会在无竞争的程序中引入数据竞争,因此 C++11 规范不允许此类优化。现有编译器现在必须验证(并在必要时调整)所有优化。
有关详细信息,请参阅并发内存模型编译器后果。
并不是说它们不支持内存模型,而是它们(尚)不支持标准中用于与内存模型交互的 API。 该 API 包含许多互斥体。
然而,一段时间以来,Clang 和 GCC 都在没有正式标准的情况下尽可能地支持线程。 您不必担心优化会将事情移至原子操作的错误一侧。