基于 OpenMP 的 Pytorch 与 CUDA 扩展
我尝试使用libtorch和OpenMP开发pytorch扩展。 当我测试我的代码时,它在 CPU 模型中运行良好,大约需要 1 秒才能完成所有操作: s = 时间.time() adj_矩阵 =