无法解析的外部符号 _cublascreate_v2@4,等一系列的类似问题(用于x64位。)以及vs2013+cuda8.0+win10配置过程_cuda程序报错无法解析的外部符号cublascreate_v2,该函数在main函数中被引用-程序员宅基地

技术标签: cuda8.0  vs2013  vs  

首先贴出我的问题,解决的就是这个问题。要解决这个问题,首先要看你的cuda环境配置的是否正确,那么就要从头跟着我们走一遍,再检查一下您配置的是否正确。

1>1.cu.obj : error LNK2019: 无法解析的外部符号 cublasDestroy_v2,该符号在函数 main 中被引用

 

1>1.cu.obj : error LNK2019: 无法解析的外部符号 cudaFree,该符号在函数 main 中被引用
1>1.cu.obj : error LNK2019: 无法解析的外部符号 cublasGetVector,该符号在函数 main 中被引用
1>1.cu.obj : error LNK2019: 无法解析的外部符号 cublasSgemm_v2,该符号在函数 main 中被引用
1>1.cu.obj : error LNK2019: 无法解析的外部符号 cudaThreadSynchronize,该符号在函数 main 中被引用

 

1>1.cu.obj : error LNK2019: 无法解析的外部符号 cublasSetVector,该符号在函数 main 中被引用

首先官网下载安装包,这个就不细说了 ,我下的是这个版本cuda_8.0.61_win10.exe,,注意win7和win10版本要对应,千万别弄错了 之后双击会出现如下截图,

解压完以后一直点下一步如下图

 

出现这个等半个小时左右就好了

安装结束后开始配置系统环境变量

win10可以这么操作win+s 搜索环境,自动匹配出系统环境变量

打开环境变量后如下图:

如图中点击环境变量的就是了打开后,如下图设置:

 

CUDA_PATH = C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0

CUDA_PATH_V8_0 = C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0

以上两个系统我的是安装上cuda后就有的,没有的自行添加。

CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0
CUDA_LIB_PATH = %CUDA_PATH%\lib\x64
CUDA_BIN_PATH = %CUDA_PATH%\bin
CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

将上面的变量名和变量值依次填入:

比如:

依次填入后,找到path如图:

 

依次点击新建,将 %CUDA_LIB_PATH%;%CUDA_BIN_PATH%;%CUDA_SDK_BIN_PATH%;%CUDA_SDK_LIB_PATH%;依次填入,填入后效果如上图所示。全部安装好后一定要记得重启!,这里就将cuda 在win10中如何配置的完成了

配置完环境变量后

检验CUDA环境是否配置成功:

A.打开cmd窗口,输入:nvcc -V,屏幕上会显示nvcc编译器的版本信息。

b.打开cmd窗口,输入:

cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\extras\demo_suite
bandwidthTest.exe
deviceQuery.exe

如果两者都是:Rsult=PASS,说明安装和配置成功啦;否则可能需要重装。

 

如果通过前面的编译通过了,下面的过程可以省去,过程和上面的一样,直接去看vs2013的配置

编译CUDA的Samples: 

用VS2013打开:C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\Samples_vs2013.sln 

分别编译这两个文件,编译结束后,进入C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\bin\win64\Release会发现我们刚编译出的bandwidthTest.exedeviceQuery.exe,在cmd窗口中运行,结果应与上面相同。

如果编译过程中,未找到CUDA 8.0.props,会出现如下提示:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\extras\visual_studio_integration\MSBuildExtensions\目录下的4个文件,复制到C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V120\BuildCustomizations目录下,然后重新启动VS2013即可。

 

 

接下来需要再配置vs2013了

1.打开vs2013并创建一个空项目程序,创建一个cuda_samples的解决方案和cuda_test1项目: 

2.右键源文件–>添加–>新建项,如下图所示

3.选择NIVIDIA CUDA7.5中 CUDA C/C++file,并在名称那填上cuda_main

 

  • 4.选择cuda_test1,点击右键–>项目依赖项–>自定义生成

 

  • 5.选择CUDA7.5

 

  • 6.点击cuda_main.cu的属性

7.在配置属性–>常规–>项类型–>选择“CUDA C/C++”

 

最重要的一步出现啦,就是这一步导致体重无法解析外部符号的问题

接下来进行项目配置

右键点击项目属性–>属性–>配置管理器–>活动解决方案平台->新建->键入或选择新平台->选择“x64”。

这一步别告诉我你弄不好。如果不行的话,你可以换一下活动解决方案和活动解决平台,总有一个适合你的项目

 

 x64

1.包含目录配置

  • 1.右键点击项目属性–>属性–>配置属性–>VC++目录–>包含目录
  • 2.添加包含目录: 
    $(CUDA_PATH)\include

1.2 库目录配置

  • 1.VC++目录–>库目录
  • 2.添加库目录: 
    $(CUDA_PATH)\lib\x64

1.3 依赖项

    1. 配置属性–>连接器–>输入–>附加依赖项
    1. 添加库文件: 
      cublas.lib
      cublas_device.lib
      cuda.lib
      cudadevrt.lib
      cudart.lib
      cudart_static.lib
      cufft.lib
      cufftw.lib
      curand.lib
      cusolver.lib
      cusparse.lib
      nppc.lib
      nppi.lib
      nppial.lib
      nppicc.lib
      nppicom.lib
      nppidei.lib
      nppif.lib
      nppig.lib
      nppim.lib
      nppist.lib
      nppisu.lib
      nppitc.lib
      npps.lib
      nvblas.lib
      nvcuvid.lib
      nvgraph.lib
      nvml.lib
      nvrtc.lib
      OpenCL.lib
      cudnn.lib(选填,当安装cudnn时)(都添加上是没有错的,相信我)

注意:添加nvcuvenc.lib库文件,编译时,报找不到该文件的错误。去掉后,程序也能运行

接下来把下面程序拷贝到

 

// CUDA runtime 库 + CUBLAS 库 
#include "cuda_runtime.h" 
#include "cublas_v2.h" 
#include <time.h> 
#include <iostream> 

using namespace std;
// 定义测试矩阵的维度 
int const M = 5;
int const N = 10;
int main()
{
// 定义状态变量 
cublasStatus_t status; 
// 在内存中为将要计算的矩阵开辟空间 
float *h_A = (float*)malloc(N*M*sizeof(float));
float *h_B = (float*)malloc(N*M*sizeof(float));
// 在 内存 中为将要存放运算结果的矩阵开辟空间 
float *h_C = (float*)malloc(M*M*sizeof(float));
// 为待运算矩阵的元素赋予 0-10 范围内的随机数 
for (int i = 0; i<N*M; i++) {
    h_A[i] = (float)(rand() % 10 + 1);
    h_B[i] = (float)(rand() % 10 + 1);
}
// 打印待测试的矩阵 
cout << "矩阵 A :" << endl;
for (int i = 0; i<N*M; i++){
    cout << h_A[i] << " ";
    if ((i + 1) % N == 0) cout << endl;
}
cout << endl;
cout << "矩阵 B :" << endl;
for (int i = 0; i<N*M; i++){
    cout << h_B[i] << " ";
    if ((i + 1) % M == 0) cout << endl;
}
cout << endl;
/*
    ** GPU 计算矩阵相乘
    */
// 创建并初始化 CUBLAS 库对象
cublasHandle_t handle;
status = cublasCreate(&handle);
if (status != CUBLAS_STATUS_SUCCESS)
{
    if (status == CUBLAS_STATUS_NOT_INITIALIZED) {
        cout << "CUBLAS 对象实例化出错" << endl;
    }
    getchar();
    return EXIT_FAILURE;
}
float *d_A, *d_B, *d_C;
// 在 显存 中为将要计算的矩阵开辟空间 
cudaMalloc(
    (void**)&d_A, // 指向开辟的空间的指针 
    N*M * sizeof(float) // 需要开辟空间的字节数 
    );
cudaMalloc(
    (void**)&d_B,
    N*M * sizeof(float)
    );
// 在 显存 中为将要存放运算结果的矩阵开辟空间 
cudaMalloc(
    (void**)&d_C,
    M*M * sizeof(float)
    );
// 将矩阵数据传递进 显存 中已经开辟好了的空间 
cublasSetVector(
    N*M, // 要存入显存的元素个数 
    sizeof(float), // 每个元素大小 
    h_A, // 主机端起始地址 
    1, // 连续元素之间的存储间隔 
    d_A, // GPU 端起始地址 
    1 // 连续元素之间的存储间隔 
    );
cublasSetVector(
    N*M,
    sizeof(float),
    h_B,
    1,
    d_B,
    1
    );
// 同步函数
cudaThreadSynchronize();
// 传递进矩阵相乘函数中的参数,具体含义请参考函数手册。 
float a = 1; float b = 0;
// 矩阵相乘。该函数必然将数组解析成列优先数组 
cublasSgemm(
    handle, // blas 库对象 
    CUBLAS_OP_T, // 矩阵 A 属性参数 
    CUBLAS_OP_T, // 矩阵 B 属性参数
    M, // A, C 的行数 
    M, // B, C 的列数
    N, // A 的列数和 B 的行数
    &a, // 运算式的 α 值 
    d_A, // A 在显存中的地址 
    N, // lda 
    d_B, // B 在显存中的地址 
    M, // ldb 
    &b, // 运算式的 β 值 
    d_C, // C 在显存中的地址(结果矩阵) 
    M // 
    );
// 同步函数 
cudaThreadSynchronize();
// 从 显存 中取出运算结果至 内存中去
cublasGetVector(M*M, // 要取出元素的个数 
    sizeof(float), // 每个元素大小 
    d_C, // GPU 端起始地址 
    1, // 连续元素之间的存储间隔 
    h_C, // 主机端起始地址
    1 // 连续元素之间的存储间隔 
    );
// 打印运算结果 
cout << "计算结果的转置 ( (A*B)的转置 ):" << endl;
for (int i = 0; i<M*M; i++){
    cout << h_C[i] << " ";
    if ((i + 1) % M == 0) cout << endl;
}
// 清理掉使用过的内存 
free(h_A);
free(h_B);
free(h_C);
cudaFree(d_A);
cudaFree(d_B);
cudaFree(d_C);
// 释放 CUBLAS 库对象
cublasDestroy(handle);
getchar();
return 0;
}

运行结构贴上,错误已解决,不容易啊,

 

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/xianhua7877/article/details/80792027

智能推荐

使用JDBC连接数据库出现 The server time zone value ‘�й���׼ʱ��‘ is unrecognized or represents more than one解决方案_jdbc.properties timezone-程序员宅基地

文章浏览阅读553次。在 jdbc.properties 文件中的 url 后面加上 ?serverTimezone=UTC加入之前的jdbc.properties文件:user=rootpassword=12345678url=jdbc:mysql://localhost:3306/testdriverClass=com.mysql.cj.jdbc.Driver加入之后:user=rootpassword=12345678url=jdbc:mysql://localhost:3306/test?serv_jdbc.properties timezone

计算机图形学孔令德基础知识,计算机图形学基础教程孔令德答案-程序员宅基地

文章浏览阅读1.4k次。计算机图形学基础教程孔令德答案【篇一:大学计算机图形学课程设】息科学与工程学院课程设计任务书题目:小组成员:巴春华、焦国栋成员学号:专业班级:计算机科学与技术、2009级本2班课程:计算机图形学指导教师:燕孝飞职称:讲师完成时间: 2011年12 月----2011年 12 月枣庄学院信息科学与工程学院制2011年12 月20日课程设计任务书及成绩评定12【篇二:计算机动画】第一篇《计算机图形学》..._计算机图形学基础教程 孔令德 答案

python xlwings追加数据_大数据分析Python库xlwings提升Excel工作效率教程-程序员宅基地

文章浏览阅读1k次。原标题:大数据分析Python库xlwings提升Excel工作效率教程Excel在当今的企业中非常非常普遍。在AAA教育,我们通常建议出于很多原因使用代码,并且我们的许多数据科学课程旨在教授数据分析和数据科学的有效编码。但是,无论您偏爱使用大数据分析Python的程度如何,最终,有时都需要使用Excel来展示您的发现或共享数据。但这并不意味着仍然无法享受大数据分析Python的某些效率!实际上,..._xlwings通过索引添加数据

java8u211_jre864位u211-程序员宅基地

文章浏览阅读911次。iefans为用户提供的jre8 64位是针对64位windows平台而开发的java运行环境软件,全称为java se runtime environment 8,包括Java虚拟机、Java核心类库和支持文件,不包含开发工具--编译器、调试器和其它工具。jre需要辅助软件--JavaPlug-in--以便在浏览器中运行applet。本次小编带来的是jre8 64位官方版下载,版本小号u211版..._jre8是什么

kasp技术原理_KASP基因分型-程序员宅基地

文章浏览阅读5k次。KASP基因分型介绍KASP(Kompetitive Allele-Specific PCR),即竞争性等位基因特异性PCR,原理上与TaqMan检测法类似,都是基于终端荧光信号的读取判断,每孔反应都是采用双色荧光检测一个SNP位点的两种基因型,不同的SNP对应着不同的荧光信号。KASP技术与TaqMan法类似,它与TaqMan技术不同的是,它不需要每个SNP位点都合成特异的荧光引物,它基于独特的..._kasp是什么

华为p50预装鸿蒙系统,华为p50会不会预装鸿蒙系统_华为p50会预装鸿蒙系统吗-程序员宅基地

文章浏览阅读154次。华为现在比较火的还真就是新开发的鸿蒙系统了,那么在即将上市的华为p50手机上会不会预装鸿蒙系统呢?接下来我们就来一起了解一下华为官方发布的最新消息吧。1.华为p50最新消息相信大家都知道,随着华为鸿蒙OS系统转正日期临近,似乎全网的花粉们都在关注华为鸿蒙OS系统优化、生态建设等等,直接忽略了不断延期发布的华为P50手机,如今华为P50系列手机终于传来了最新的好消息,在经过一系列方案修改以后,终于被..._华为手机p50直接预装鸿蒙系统

随便推点

python用什么软件编程好-初学python编程,有哪些不错的软件值得一用?-程序员宅基地

文章浏览阅读2.1k次。Python编程的软件其实许多,作为一门面向大众的编程言语,许多修正器都有对应的Python插件,当然,也有特地的PythonIDE软件,下面我简单引见几个不错的Python编程软件,既有修正器,也有IDE,感兴味的朋友可以本人下载查验一下:1.VSCode:这是一个轻量级的代码修正器,由微软规划研发,免费、开源、跨途径,轻盈活络,界面精练,支撑常见的自动补全、语法提示、代码高亮、Git等功用,插..._python入门学什么好

pytorch一步一步在VGG16上训练自己的数据集_torch vgg训练自己的数据集-程序员宅基地

文章浏览阅读3.2w次,点赞30次,收藏307次。准备数据集及加载,ImageFolder在很多机器学习或者深度学习的任务中,往往我们要提供自己的图片。也就是说我们的数据集不是预先处理好的,像mnist,cifar10等它已经给你处理好了,更多的是原始的图片。比如我们以猫狗分类为例。在data文件下,有两个分别为train和val的文件夹。然后train下是cat和dog两个文件夹,里面存的是自己的图片数据,val文件夹同train。这样我们的..._torch vgg训练自己的数据集

毕业论文管理系统设计与实现(论文+源码)_kaic_论文系统设计法-程序员宅基地

文章浏览阅读968次。论文+系统+远程调试+重复率低+二次开发+毕业设计_论文系统设计法

在python2与python3中转义字符_Python 炫技操作:五种 Python 转义表示法-程序员宅基地

文章浏览阅读134次。1. 为什么要有转义?ASCII 表中一共有 128 个字符。这里面有我们非常熟悉的字母、数字、标点符号,这些都可以从我们的键盘中输出。除此之外,还有一些非常特殊的字符,这些字符,我通常很难用键盘上的找到,比如制表符、响铃这种。为了能将那些特殊字符都能写入到字符串变量中,就规定了一个用于转义的字符 \ ,有了这个字符,你在字符串中看的字符,print 出来后就不一定你原来看到的了。举个例子>..._pytyhon2、python3对%转义吗

java jar 文件 路径问题_「问答」解决jar包运行时相对路径问题-程序员宅基地

文章浏览阅读1.3k次。我这几天需要做一个Java程序,需要通过jar的形式运行,还要生成文件。最终这个程序是要给被人用的,可能那个用的人还不懂代码。于是我面临一个问题:生成的文件一定不能存绝对路径。刚开始我想得很简单,打绝对路径改成相对路径不就行了吗?于是有了这样的代码:String path = "../test.txt";File file = new File(path);……这个写法本身并没有问题,直接运行代码..._jar启动文件路径中存在!

微信读书vscode插件_曾经我以为 VSCode 是程序员专属的工具,直到发现了这些……...-程序员宅基地

文章浏览阅读598次。如果你知道 VSCode,一说起它,你可能第一个想到的就是把它当做一个代码编辑器,而它的界面应该可能大概率是这样的——如果你恰好又是个程序员,那你可能经常会用到它,不管是 Python、JS 还是 C++ 等各种语言对应的文件,都可以用它来进行简单的编辑和整理,甚至是运行和 debug......但是今天要讲的显然不是这些,经过小美的多方研究,发现了即使是对于大多数并不了解 VSCode,也完全不..._vscode weixin read

推荐文章

热门文章

相关标签