如何让线程块中的每个线程都有自己的共享内存指针?我找到了一些声明此类指针的示例:
int __shared__ *p;
__shared__ int array[256];
p = &array[threadId];
这样对还是有别的办法?
不,那不是正确的方法。在该示例代码中,
p
是共享的,因此这意味着块中的每个线程都将尝试访问同一块内存。如果 threadId
是块的唯一线程索引,你可以这样做:
int *p;
__shared__ int array[256];
p = &array[threadId];
在这种情况下,编译器将使用寄存器或线程本地内存来为块中的每个线程存储静态共享内存分配中元素的唯一地址
array
。
你是对的。更好的方法是动态分配共享内存。一个例子是同胞:
void __global__ test(){
extern __shared__ int s[];
int *p = &s[xx];
}
...
test<<<x,y, shared memory length>>>();
...