欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

华为matebook win+deepin 15.11双系统 + 双显卡 + 使用/卸载大黄蜂方案 + NVIDIA独显驱动安装 + tensorflow-gpu-2.0

程序员文章站 2022-07-13 13:39:46
...

先说结果,我没安装成功NVIDIA的最新驱动,因为我的BIOS上没有切换显卡的设置。
但是我觉得有几个需要说的提醒在这里总结一下!
1、如果你之前在windows上没有装过NVIDIA驱动或CUDA,可以通过这个网站看你的 显卡是否支持CUDA

2、如果你的深度显卡驱动管理器中没有NV-Prime方案(如 deepin 15.11这个最新版本就删掉了这个方案),那你可以继续往下看。

3、先看看你的BIOS上支不支持切换显卡驱动,不支持的话,安装独显驱动很可能是无功而返!

4、如果你已经成功的使用上了大黄蜂方案,而且你要求的一些环境不高的话(比如你不用tensorflow2.0,tf2.0要求CUDA10.0,即驱动版本>=410.48),装个CUDA8、CUDA9还是可以的。deepin的驱动更新慢已经是常态了,不知道后续深度会不会更新(更新了的话,评论区提醒我一声儿呗)。下表是NVIDIA驱动和CUDA兼容表。

华为matebook win+deepin 15.11双系统 + 双显卡 + 使用/卸载大黄蜂方案 + NVIDIA独显驱动安装 + tensorflow-gpu-2.0

一、大黄蜂方案下的cuda + cudnn + tensorflow-gpu版本安装

通过nvidia-smi,我们可以查看显卡信息,以确认我们的驱动是否正确安装了,在终端内输入:

optirun nvidia-smi

显卡信息可以看到你的驱动版本,从而选择适合的CUDA和CuDNN版本。
若是显卡驱动安装正确,运行上面的命令,你会看到相似于下面的输出,驱动版本是390.87:
华为matebook win+deepin 15.11双系统 + 双显卡 + 使用/卸载大黄蜂方案 + NVIDIA独显驱动安装 + tensorflow-gpu-2.0

大黄蜂方案的显卡驱动是由bumblebee进行管理的。为了下降能耗,平时独显是处于关闭状态的,若是有程序须要使用到独显,需要经过optirun进行启动。
关于bumblebee版显卡驱动在深度学习训练中的开启和关闭:
在进行训练前,在终端输入sudo tee /proc/acpi/bbswitch <<< ON,可开启显卡。
在训练结束后,在终端输入sudo tee /proc/acpi/bbswitch <<< OFF,可关闭显卡。

具体参考:
《deepin-15.5 + 小米笔记本pro 下的深度学习环境cuda8 +tensorflow-gpu-1.4版本搭建过程》


二、如果你的BIOS支持切换显卡驱动,请将N卡设为初始显卡

那你算是比较幸运的了,虽然没有NV-Prime方案,但是给了打开了一扇窗。

1、如果你之前使用过大黄蜂方案,需要删除大黄蜂所安装的软件,可以用以下命令:

dpkg -l | grep -i nvidia | awk '{ print $2 }' | cut -d: -f1 | xargs apt-get -y remove --purge

如果报错——无法打开锁文件 /var/lib/dpkg/lock - open (13: 权限不够),可以sudo -s 输入一次密码 进入root模式,再重试。

2、如果你在看到这篇之前,已经下载了不合意的驱动,或是上面删除大黄蜂所安装软件后,
还需要输入dpkg -l | grep -i nvidia命令来查看是否还有残余驱动,如果还有显示,则输入下面命令进行卸载:

sudo apt-get --purge remove nvidia*

3、安装编译所需的软件

sudo apt -y install linux-headers-amd64 linux-headers-deepin-amd64 gcc make dkms

剩下的步骤参考:使用其【快捷方法】即可。
深度科技论坛——如何手动安装NVIDIA驱动软件


三、下载CUDA和CuDNN

去官网下载适合你的CUDA,注意要和你的驱动适配,如果要安装tensorflow2.0建议CUDA10.0或10.1。
《下载适合你的CUDA》
《下载适配的CuDNN》

下载好后,
如果有图形化界面则需要禁用x-window服务
右键属性=>允许作为可执行程序执行,双击终端运行即可。
或者输入下面的命令(文件名自行调整)

sudo sh cuda_8.0.61_375.26_linux.run

这个时候会有很多提示需要你确认,由于在第一步已经成功安装了显卡驱动,所以这里就不需要再次安装了,因此 ,Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 3XX.XX ?这里选择 no,其余都是yes或者accept

最后在.bashrc添加环境变量后source .bashrc

export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

参考:《linux安装GPU显卡驱动、CUDA和cuDNN库》


四、遇到的一些问题

不知道是笔记本的原因还是因为deepin系统没装好,在我Ctrl+Alt+f1进入tty1文本控制台时,会有持续不断的报错,反复report,下面的这个report会一直往下输出循环。如果你也遇到了这个,不要慌,像平常一样硬着头皮输入你的命令,就算是被report分隔都还是可以运行的(如果输入错了,可以Ctrl+C重新输入)

deepin linux  not implement report

五、安装tf2.0并测试

你可以在终端中输入pip install tensorflow-gpu==2.0.0b1即可,如果觉得下载慢可以更换到国内的阿里云镜像源。
完成后,
在终端中打开并输入python。

>>> import tensorflow as tf
>>> tf.test.is_gpu_available()

如果结果是True,恭喜你安装成功!


参考:
《deepin-15.5 + 小米笔记本pro 下的深度学习环境cuda8 +tensorflow-gpu-1.4版本搭建过程》
《Ubuntu 卸载nvidia驱动、CUDA Toolkit》
深度科技论坛——如何手动安装NVIDIA驱动软件

相关标签: 软件工具