一旦张量流处于活动状态。即使我使用
sess.close()
...,它也会使每个 cuda 代码崩溃
错误消息是:
pycuda._driver.LogicError:cuFuncSetBlockShape失败:无效 资源句柄
以下代码是 pycuda 运行的简单示例 cuda 代码:
一旦我添加
sess = tf.Session()
。我的cuda代码崩溃了。没有sess = tf.Session()
,它工作正常。
import tensorflow as tf
import pycuda.autoinit
import pycuda.driver as drv
import numpy
from pycuda.compiler import SourceModule
mod = SourceModule("""
__global__ void multiply_them(float *dest, float *a, float *b)
{
const int i = threadIdx.x;
dest[i] = a[i] * b[i];
}
""")
## tensorflow will make any other cuda code crash............
sess = tf.Session()
sess.close()
## tensorflow will make any other cuda code crash............
multiply_them = mod.get_function("multiply_them")
a = numpy.random.randn(400).astype(numpy.float32)
b = numpy.random.randn(400).astype(numpy.float32)
dest = numpy.zeros_like(a)
multiply_them(drv.Out(dest), drv.In(a), drv.In(b), block=(400,1,1), grid=(1,1))
print (dest-a*b)
print("finish")
有什么建议吗?谢谢~~~
我怀疑与这里同样的问题:pycuda 和 scikit-cuda 可以一起工作吗?
简短回答:不要使用
import pycuda.autoinit
;这会创建一个新的 CUDA 上下文,您必须手动管理(推送和弹出)。
相反,请使用
import pycuda.autoprimaryctx
保留大多数其他 CUDA 应用程序自动使用的现有主 CUDA 上下文。