查看CUDA版本
nvidia-smi
一、卸载显卡驱动
sh cuda_11.3.1_465.19.01_linux.run --uninstall
二、下载显卡驱动
⚠️注意:
建议不提前安装显卡驱动,通过cuda统一进行安装,以防版本问题!
首先确定GPU服务器类型,驱动下载地址
三、下载CUDA
1、选择正确的CUDA版本
下载地址
这里我选择11.3
版本,下载地址为:CUDA Toolkit 11.3 Downloads
查看Linux服务的Architecture,选择正确的版本下载
# 查看linux服务器架构
uname -m
# x86_64
# 查看版本信息
lsb_release -a
运行下方的shell命令
wget https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.run
# 下载缓慢,使用英伟达中国区官网,服务器在北京(.cn)
curl -O https://developer.download.nvidia.cn/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.run
sudo sh cuda_11.3.1_465.19.01_linux.run
如果当前环境有显卡驱动,在安装时需要注释掉driver安装,否则会报错。如果没有,则直接选择install
2、下载安装cudnn
cudnn下载地址
我们这里选择11.x
安装cudnn
tar -xvf cudnn-linux-x86_64-8.9.6.50_cuda11-archive.tar
sudo cp cudnn-linux-x86_64-8.9.6.50_cuda11-archive/include/cudnn.h /usr/local/cuda-11.3/include
sudo cp cudnn-linux-x86_64-8.9.6.50_cuda11-archive/lib/libcudnn* /usr/local/cuda-11.3/lib64
sudo chmod a+r /usr/local/cuda-11.3/include/cudnn.h /usr/local/cuda-11.3/lib64/libcudnn*
四、设置环境变量
vim ~/.bashrz
export CUDA_HOME=/usr/local/cuda-11.3
export PATH=/usr/local/cuda-11.3/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH
export CUDA_ROOT=/usr/local/cuda-11.3
# source生效
source ~/.bashrz
五、查看nvcc版本
六、python校验cuda是否生效
# 进入python程序
python
>>>import torch
>>>torch.__version__
>>>torch.cuda.is_available()
参考: