我正在开发一个使用 C++ 源代码和 CUDA 的示例程序。 这是我的四个源文件中的基本内容。
matrixmul.cu(主要CUDA源代码):
#include <stdlib.h>
#include <cutil.h>
#include "assist.h"
#include "matrixmul.h"
int main (int argc, char ** argv)
{
...
computeGold(reference, hostM, hostN, Mh, Mw, Nw); //reference to .cpp file
...
}
matrixmul_gold.cpp(C++源代码,单一函数,无main方法):
void computeGold(float * P, const float * M, const float * N, int Mh, int Mw, int Nw)
{
...
}
matrixmul.h(matrixmul_gold.cpp 文件的头文件)
#ifndef matrixmul_h
#define matrixmul_h
extern "C"
void computeGold(float * P, const float * M, const float * N, int Mh, int Mw, int Nw);
#endif
assist.h(辅助函数)
我正在尝试编译和链接这些文件,以便它们能够正常工作。 到目前为止,我可以使用以下方法编译matrixmul_gold.cpp:
g++ -c matrixmul_gold.cpp
我可以使用以下方法编译 CUDA 源代码而不会出现错误:
nvcc -I/home/sbu/NVIDIA_GPU_Computing_SDK/C/common/inc -L/home/sbu/NVIDIA_GPU_Computing_SDK/C/lib matrixmul.cu -c -lcutil_x86_64
但是我最终得到了两个 .O 文件。 我已经尝试了很多不同的方法来链接两个 .O 文件,但到目前为止这是行不通的。 正确的做法是什么?
更新:根据要求,这里是输出:
nm matrixmul_gold.o matrixmul.o | grep computeGold
nm: 'matrixmul.o': No such file
0000000000000000 T _Z11computeGoldPfPKfS1_iii
我认为“matrixmul.o”缺失错误是因为我在运行建议的编译命令时实际上并未成功编译:
nvcc -I/home/sbu/NVIDIA_GPU_Computing_SDK/C/common/inc -L/home/sbu/NVIDIA_GPU_Computing_SDK/C/lib -o matrixmul matrixmul.cu matrixmul_gold.o -lcutil_x86_64
更新2:我在matrixmul_gold.cpp 的开头丢失了一个
extern "C"
。 我添加了这一点,建议的编译命令效果很好。 谢谢!
按照惯例,您将使用您正在使用的任何编译器来编译包含主子例程的代码以链接应用程序。在这种情况下,您的 main 位于
.cu
中,因此请使用 nvcc 进行链接。像这样的东西:
$ g++ -c matrixmul_gold.cpp
$ nvcc -I/home/sbu/NVIDIA_GPU_Computing_SDK/C/common/inc \
-L/home/sbu/NVIDIA_GPU_Computing_SDK/C/lib \
-o matrixmul matrixmul.cu matrixmul_gold.o -lcutil_x86_64
这将链接来自
matrimul
、matrixmul.cu
和 cutil 库的名为 matrixmul_gold.o
的可执行二进制文件(隐式 nvcc 还将链接 CUDA 运行时库和 CUDA 驱动程序库)。