ubuntu16卸载及安装新的nvidia驱动,cuda,cudnn
1.卸载nvidia driver
我的电脑配置:
显卡:Geforce gtx 650
ubuntu16.04
之前安装了nvidia384.130,cuda9.0和cudnn7,在复现pointnet时提示driver版本过太老了,只能卸载重装。
卸载驱动:
sudo apt-get remove --purge nvidia*
安装新版本的驱动的话,我是直接在系统设置-软件和更新-附加驱动中,选择440,点击应用更改,如下图所示:
2.卸载旧的cuda,安装新cuda10.2
安装440.100的nvidia driver后,到cuda官网可查到对应cuda版本为10.2。首先卸载原来的cuda9.0,主要执行cuda自带的卸载脚本,在安装时都会说明。注意如果以后想用pytorch的话,暂时不要安装cuda11,后面会说明原因。
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
卸载之后,还会提示有一个文件夹没有卸载干净,对应的cudnn的一些文件,可以用以下命令:
sudo rm -rf /usr/local/cuda-9.0/
安装新的cuda,直接到官网cuda选择对应版本,根据官网给出的命令,下载.run文件安装即可。这里注意需要先修改run文件的权限。
sudo chmod a+x cuda_10.2.89_440.33.01_linux.run
配置环境变量:
sudo gedit ~/.bashrc
export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc
用nvcc --version查看是否安装成功。
3.卸载旧cudnn,安装新cudnn
一般在卸载cuda时已经把cudnn对应的文件夹也卸载了,可以查看以下两个文件夹,如果还在用就删除。
sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/loca/cuda/lib64/libcudnn*
安装新的cudnn,在https://developer.nvidia.com/cudnn下载对应cuda10.2版本的cudnn8,选择cudnn library for linux(x86)下载,解压文件得到cuda文件夹,进入文件夹里,按以下命令将软件包复制。
sudo cp include/cudnn.h /usr/local/cuda/include/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo cp lib64/lib* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
4.配置对应的pytorch-gpu
之前按原来电脑配置用anaconda创建了一个pytorch虚拟环境,安装了pytorch-gpu1.10版本的,现在需要删除这个环境安装新的。
conda remove -n pytorch --all //卸载conda虚拟环境
再新建一个虚拟环境
conda create -n pytorch python=3.7
在pytorch官网上搜对应新配置的pytorch,根据官网命令安装即可。这里需要小小注意一下,cuda11已经发布了,但pytorch没有对应cuda11的版本,最高只有cuda10.2.
上一篇: git HTTP 上传