AI_GPU-硬件-驱动-cuda

发布时间 2024-01-05 10:56:52作者: 辰令

硬件

GeForce 系列 是英伟达主打的消费级GPU产品线
Quadro  系列 是英伟达专业级GPU产品线,针对商业和专业应用领域进行了优化 NVIDIA Quadro P1000显卡
Jetson  系列 是面向边缘计算和人工智能应用的嵌入式开发平台,具备强大的计算和推理能力: 
 	Jetson Orin | NVIDIA
Tesla   系列(T系列)     
    V100s  NVIDIA tesla V100s 显卡 32g  PCIE
    A100 采用 NVIDIA Ampere 架构,是 NVIDIA 数据中心平台的引擎
    A800 SXM4-80G
    H100  
    H800
	 八卡 A800 服务器的转售价格超 200 万元,H800 服务器更是一台售价 300 多万元。A800 和 H800 都对华特供 2023年
显卡接口 服务器之间的通信
  PCIe(peripheral component interconnect express)是一种高速串行计算机扩展总线标准 
  SXM SXM4 是英伟达公司设计出来的,它的出现主要是为高性能计算和数据中心提高更强的计算能力和传输速度 
  NVL NVLink-C2C是一种板级互连技术
显存容量
  32G 80G

硬件驱动

lspci -vnn | grep VGA 
nvidia-smi
    NVIDIA driver version 11060
	NVIDIA_SMI  510.54
	Driver Version 510.54
	Cuda version 11.6
	
Linux X64 (AMD64/EM64T) Display Driver
  版本:	535.146.02
  发布日期:	2023.12.7
  操作系统:	Linux 64-bit

cuda

cuda-toolkit
    CUDA 12.3.x   >=525.60.13
	CUDA 12.0.x   >=525.60.13
	CUDA 11.8.x   >=450.80.02
	CUDA 11.6.x   >=450.80.02

异构算力集群

 异构算力集群   
 pip install pytorch==1.13.0 torchvision=0.14.0 torchaudio==0.03.0 pytorch-cuda=11.6 -c pytotvh -c nvidia
 CUDA_VISIBLE_DEVICES=0,2,3

参考

 英伟达不同系列GPU介绍 https://blog.csdn.net/kesenzhang/article/details/134631176
 NVIDIA CUDA Toolkit Release Notes https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
 风起云涌的“算力之年” 国产算力成最好选择
 https://pytorch.org/get-started/previous-versions/
 https://drive.google.com/drive/folders/1wpY-upCo4GIW4wVPnlMh_ym779lLIG2A