欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

【转载】failed to initialize nvml driver/library version mismatch ubuntu

程序员文章站 2023-10-17 20:23:27
英伟达驱动版本是384.130 显示的NVRM version: NVIDIA UNIX x86_64 Kernel Module是:384.130。 若是旧的版本就会出现如下问题。 这个问题出现的原因是kernel mod 的 Nvidia driver 的版本没有更新,一般情况下,重启机器就能够 ......

【转载】failed to initialize nvml driver/library version mismatch ubuntu

英伟达驱动版本是384.130

【转载】failed to initialize nvml driver/library version mismatch ubuntu

显示的nvrm version: nvidia unix x86_64 kernel module是:384.130。 若是旧的版本就会出现如下问题。

这个问题出现的原因是kernel mod 的 nvidia driver 的版本没有更新,一般情况下,重启机器就能够解决,如果因为某些原因不能够重启的话,也有办法reload kernel mod。

方法如下:

 

就两步

  1. unload nvidia kernel mod
  2. reload nvidia kernel mod

执行

  1. sudo rmmod nvidia
  2. sudo nvidia-smi

若出现问题

  1. $ sudo rmmod nvidia
  2. rmmod: error: module nvidia is in use by: nvidia_modeset nvidia_uvm

这时,就要一点一点的卸载整个驱动了,首先要知道现在kernel mod 的依赖情况,首先我们从错误信息中知道,nvidia_modeset nvidia_uvm 这两个 mod 依赖于 nvidia, 所以要先卸载他们

【转载】failed to initialize nvml driver/library version mismatch ubuntu

 

先查看下有哪些进程使用了 nvidia*

```

sudo fuser -v /dev/nvidia* #查找占用gpu资源的pid

sudo lsof -n -w /dev/nvidia* #查找占用gpu资源的pid

```

【转载】failed to initialize nvml driver/library version mismatch ubuntu

这些进程有个了解,如果一会卸载失败,记得关闭相关进程。

卸载

  1. sudo rmmod nvidia_uvm
  2. sudo rmmod nvidia_modeset

 

 

 

#参考文献

解决driver/library version mismatch

nvidia驱动问题解决方案:failed to initialize nvml: driver/library version mismatch