nvidia-smi命令报错Failed to initialize NVML: Driver/library version mismatch

发布时间 2023-04-09 16:22:55作者: juneyiiii

首先,可以使用两个命令查看显卡驱动和系统驱动:

1、输入下条命令,查看你的显卡驱动所使用的内核版本:

cat /proc/driver/nvidia/version

Kernel Moduel为 470.161.03

2、输入下条命令,查看系统驱动:

cat /var/log/dpkg.log | grep nvidia

全部的输出内容较多,可以直接ctrl+f查找upgrade。可以看到,是在早上06:28:13,驱动由 470.161.03 更新为了 470.182.03。

由于服务器上最近一直有程序在运行,猜测是系统显卡驱动自动更新时,在运行的程序占用着显卡,导致系统无法将470.161.03的内核模块更新为470.182.03驱动的内核模块,进而无法使用。

根本原因:系统自动升级显卡驱动,在显卡驱动支持的系统内核版本相同的情况下,由于某些应用占用显卡,导致系统无法将415.27的内核模块更新未418.56驱动的内核模块,进而无法使用
解决办法:重新启动系统,禁用显卡驱动更新

禁用显卡驱动更新命令:

sudo apt-mark hold nvidia-driver-470