nvidia-smi报错:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver更优解决方案

发布时间 2023-11-14 15:26:08作者: 数据游侠

Ubuntu 18.04系统中,某次pip安装后发现这个问题,有人说是因为系统内核升级造成的,从解决方案来看,系统内核升级更可信。解决方案参考了https://blog.csdn.net/dou3516/article/details/130593616,但更简洁。解决方案是DKMS安装NVIDIA驱动。

1.首先安装dkms

sudo apt-get install dkms

2.查看已经安装,却无法通信的驱动

ls -l /usr/src

我这里是440.31.01

3. 用dkms安装驱动

sudo dkms install -m nvidia -v 440.31.01

如果运行成功,即解决,很有可能报错gcc版本太低,低于7.5.0容易出问题。

4. 查看gcc 版本

gcc --version

我这里显示是6.X版本

5. 安装gcc 7,参考链接给的方法太复杂,不推荐,直接用apt安装即可。

sudo apt install gcc-7

6. 仅仅安装并不能解决问题,需要更新不同版本gcc的优先级

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-6 60
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 70

最后的值是优先级,修改后gcc-7优先级更高,用下面的命令查看版本优先级:

7. 查看gcc版本,

gcc --version

显示是7.5.0
8. 运行dkms命令安装驱动,完全修复

sudo dkms install -m nvidia -v 440.33.01

如果还不行,可能需要更新g++,cmake等编译器版本。