摩尔线程S2000GPU环境配置

发布时间 2023-12-28 15:18:53作者: 要养家的程序猿

引子

  书接上文,这边再来一个国产AI芯片的环境配置,OK,让我们开始吧。

一、安装系统Ubuntu20.04.1
1、USB光盘刻录系统
2、安装
3、系统主板BIOS开启Above4G及Resize BAR功能
4、命令lspci | grep 123
0
二、安装GPU环境
1、安装驱动程序(服务器Ip:10.231.6.92, 账号:nick 密码:123456)
cd /work/zzq/
unzip S2000 Linux Driver.zip
cd S2000 Linux Driver
./install_mt_ddk.sh -i
2、安装其他所需包
apt install lightdm
apt install xserver-xorg-core
dpkg -P musa
dpkg -i musa_1.2.3-Ubuntu_x86_64.deb
3、验证驱动是否安装成功
cd /work/zzq/bin/LINUX/x86_64/RELEASE/
./mthreads-gmi

clinfo

 

三、安装推理环境
1、安装docker 20.10.12
sudo apt-get update
sudo apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common
sudo apt-key fingerprint 0EBFCD88
sudo add-apt-repository "deb [arch=amd64] https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu/ \  $(lsb_release -cs) \  stable"
sudo apt-get update
apt-get install docker-ce=5:20.10.12~3-0~ubuntu-focal
apt-get install docker-ce-cli=5:20.10.12~3-0~ubuntu-focal
2、安装GPU驱动
cd /work/zzq/allinone_for_ai-master/
bash install_driver.sh
bash install_dependency.sh
3、安装container工具
cd /work/zzq/
dpkg -i sgpu-dkms_1.1.1_amd64.deb
dpkg -i mtml_1.5.0-linux_amd64.deb
dpkg -i mt-container-toolkit_1.4.0-1_amd64.deb

5、启动容器
docker run -it --rm -v /work/zzq:/work 12c71ef59ec0 bash
cd /work/MT_Deliver/models/pt_models/yolo
python detect.py --weights ai_models_test/models/weights/yolo/yolov3.pt --source data/images/bus.jpg
python detect.py --weights ai_models_test/models/weights/yolo/helmet_detect.onnx --source data/images/helmet_758.jpg
四、安装训练环境
1、下载docker
docker login --username=ca-benchmark@mcconline mcconline-registry.cn-hangzhou.cr.aliyuncs.com
密码:mt123456
docker pull mcconline-registry.cn-hangzhou.cr.aliyuncs.com/presale/mtgpu-pytorch-train-benchmark-allinone:v1.0.2
2、整理数据集(与yolov5一致)
3、开始训练
docker run -it --rm --shm-size 64G -v /work/zzq:/work 76e667866943 bash
cd /work/zzq/MT_Train/mt-yolov5
python train_mul.py --data VOC_lw.yaml --epochs 50 --img 512 --cfg yolov5s.yaml --weights 'weights/yolov5s.pt' --device mtgpu --hyp hyp.VOC.yaml --num-proc 2 --batch-size 16
 
python train_mul.py --data VOC.yaml --epochs 50 --img 512 --cfg yolov5s.yaml --weights 'weights/yolov5s.pt' --device mtgpu --hyp hyp.VOC.yaml --num-proc 2 --batch-size 16
 
五、推理星图模型
1、进入推理docker环境
docker run -it --rm -v /work/zzq:/work 12c71ef59ec0 bash
2、进入目录
cd /work/FaceDetect_Retinaface/
修改detect.py文件
0
3、执行推理服务
python detect.py
0