欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置

程序员文章站 2022-03-16 18:52:22
...

手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow深度学习环境配置

本文用于配置深度学习环境。
                              _by 依雪观天澜
  工欲善其事必先利其器,想要使用深度学习,首先要配置好深度学习环境,下面首先对深度学习环境进行简介。
  TensorFlow,theano,Keras,pytorch都是比较常用深度学习框架。目前Keras已经被TensorFlow收录,添加到TensorFlow 中,成为其默认的框架,成为TensorFlow官方的高级API。
  深度学习框架都可以使用GPU进行硬件加速,往往可以比CPU运算快很多倍。因此如果你的显卡支持cuda的话,建议尽可能利用cuda加速模型训练。
  CUDA的本质是一个工具包,是NVIDIA推出的用于自家GPU的并行计算框架,也就是说CUDA只能在NVIDIA的GPU上运行,而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥CUDA的作用。
  cuDNN是一个SDK,是一个专门用于神经网络的加速包,注意,它跟我们的CUDA没有一一对应的关系,即每一个版本的CUDA可能有好几个版本的cuDNN与之对应,但一般有一个最新版本的cuDNN版本与CUDA对应更好。
nvidia与cuda需要满足关系:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html   (1)
cuda与cudnn需要满足关系:
https://developer.nvidia.com/rdp/cudnn-archive           (2)
cuda历史版本下载连接:
https://developer.nvidia.com/cuda-toolkit-archive          (3)
Tensorflow不同版本要求与CUDA及CUDNN版本对应关系:
https://blog.csdn.net/u013066730/article/details/88845083        (4)

根据上述的基本内容,选择自己的安装版本,有能跑深度学习显卡的可以考虑安装GPU加速版本。

1.安装GPU版本首先查看自己的显卡支持的版本,查看自己驱动版本的方式如下:
打开cmd,使用cd命令进入:
cd C:\Program Files\NVIDIA Corporation\NVSMI
使用“nvidia-smi”这个命令即可查看,如下我的版本为391.24
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
2.进入网址,查找适合自己显卡的cuda的版本,我的电脑适合的最高版本为CUDA9.0。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
3.进入网址下载需要的CUDA,并选择自己的系统;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
4.点击download,进行本地下载,下载完成后以管理员身份打开,还有要退出360等安全软件(否则会遇到奇形怪状的错误);
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
5.设置好安装路径,点击ok,然后等待安装包解压一会;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
6.点击同意并继续,如果电脑里面没有vs,会出现下图。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
7.Cuda提示,安装还需要visual studio的支持,所以需要安装vs,此处不做详细说明了(自主安装vs),有vs的忽略此步骤;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
8.然后就是漫长的等待过程。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
9.加载完之后,点击下一步,点击关闭,CUDA下载完毕。
10.检查CUDA是否安装成功,在cmd指令中输入nvcc -V;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
11.出现了CUDA版本号,则CUDA安装成功。
此时显卡驱动版本也变为CUDA支持的最低版本,如需升级,可再自行升级。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
12.下一步准备安装cuda对应的cudnn,进入网址2进行查询。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
13.选择合适的cudnn,此处本人选择的是7.6.5,然后选择自己电脑的系统对应的选项,点击即可下载,(下载的时候需要注册nvidia账号,自行注册,此处不再讲解);
14.下载完成后将压缩包解压,包内包含三个问价夹。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
15.将上述红框内文件复制到CUDA文件夹下,CUDA默认目录通常为C:\Program Files\NVIDIA GPU Computing Toolkit;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
16.上述步骤操作完成后,能够看到CUDA文件所在路径已经添加到了系统环境之下;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
17.下面检查cudnn是否安装成功,cmd指令进入文件cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\demo_suite下,分别输入bandwidthTest.exe和deviceQuery.exe。出现下图:
输入bandwidthTest.exe时:
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
出现 result = PASS 表示没有问题。

输入deviceQuery.exe时:
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
出现 result = PASS 表示没有问题。

至此cudnn安装完毕,使用GPU训练的加速工具,已经全部安装完毕。
下面开始深度学习框架(工具包的安装)

深度学习框架有很多,版本也各种各样,编译不同代码时常常用到不同的框架以及不同版本,因此为不同的版本搭建自己的环境。本文以tensorflow为例:
18.搭建一个新的虚拟环境,进入cmd指令中,输入conda create -n tensorflow python=3.6;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
蓝色框内tensorflow1.10 为定义的虚拟环境名称,红色框内为虚拟环境内对应的python版本。

19.然后会加载预安装内容,输入y确认安装;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
20.安装完成后如图所示;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
conda activate tensorflow指令表示**名为tensorflow的虚拟环境
conda deactivate指令表示关闭虚拟环境

21.查看虚拟环境:新建的虚拟环境位于anaconda安装包内,具体路径为C:\ProgramData\Anaconda3\envs,可以看到文件夹下有一个名为tensorflow的文件夹,即为新建的虚拟环境;
22.在cmd指令中**刚刚建立好的虚拟环境;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
图中红框内表示此时输入的指令正处于tensorflow这个虚拟环境中。
23.安装tensorflow工具包;
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
此处采用清华镜像有效提高安装速度。
pip install tensorflow -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install tensorflow_gpu -i https://pypi.tuna.tsinghua.edu.cn/simple
通常上述指令安装的均是最新版本,选择指定版本为:
pip install tensorflow_gpu==1.11 -i https://pypi.tuna.tsinghua.edu.cn/simple

其他框架同上,需要注意tensorflow1.0以上版本与tensorflow2.0以上版本有很大差别,安装需要注意根据自已代码选择合适版本。

24.Pycharm中使用配置好的深度学习环境;
File-setting-project:(文件名)-python interprefer-add-existing-选择新建的环境路径。
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
在Select Python interprefer界面可能会出现找不到Anaconda路径的情况,是因为Anaconda安装在C盘的隐藏文件夹下,点击界面上眼睛的符号,就可以展示出隐藏文件夹。
选择刚刚使用conda指令创建好的虚拟环境(envs)下python.exe解释器。
注:在Anaconda3文件夹下有一个Python解释器,此解释器处于base环境下的解释器,创建的虚拟环境的解释器均在(*\Anaconda3\envs\)文件夹内。
本人路径D:\ProgramData\Anaconda3\envs\tensorflow\python.exe

25.安装成功测试。
打开pycharm,创建.py文件,并输入:

import tensorflow as tf


a = tf.test.is_gpu_available()
print(a)
import tensorflow as tf


a = tf.test.is_gpu_available()
print(a)

手把手教你win10下GPU(cuda+cudnn)+Anaconda+Tensorflow/pytorch深度学习环境配置
当出现Ture字样,则表示tensorflow已经安装成功,且可以使用GPU对数据进行训练,False表示不能使用GPU进行训练,此时需要检查 Python cuda cudnn 显卡驱动号 以及tensorflow——gpu的版本对应关系。
对于使用CPU训练来说,只要能import tensorflow不报错,则表示,tensorflow安装成功。