nvidia-smi修改ECC状态重启后不生效

发布时间 2023-12-04 19:47:35作者: nofind1

最近跑大模型发现显卡少了几个G显存,网上一查得知开启ecc会少一部分显存,但ecc对大模型计算准确性几乎没有影响,因此打算关闭ECC校验。

在bash里面用sudo nvidia-smi -e 0​禁用了ECC之后,nvidia-smi -q -d ecc​显示Pending为Disable,但是重启之后ECC状态依旧是开启状态。进图形界面用sudo nvidia-settings​修改也是同样不生效。

折腾好久终于找到原因,是因为装了双系统,我当时是在Windows的Nvidia控制面板里面打开的ECC,导致在Linux中无法关闭,即便是Linux中的Nvidia控制面板也不行,需要重新启动到Windows里面把ECC关掉。

非常好奇为什么Windows中的Nvidia设置项优先级较高,网上也查不到相关资料。