docker构建机器学习计算环境并做无网络迁移

发布时间 2024-01-03 18:14:59作者: 数据游侠

1.docker安装

很多系统自带docker,可以跳过

2.拉取镜像

docker pull nvcr.io/nvidia/pytorch:22.12-py3

保证有足够磁盘空间,有些镜像要几十G,不然系统会出问题,看我另一篇博文

3.配置

创建一个名字为xxx的容器,运行镜像yyy

docker run --gpus all -it --name=xxx yyy /bin/bash

 

启动xxx

docker start xxx

 

进入xxx

docker exec -it yyy /bin/bash

进入后配置系统,pip安装所有需要的包

 

4.无网络迁移

将xxx导出为一个文件dockdata.tar

docker export -o dockdata.tar xxx

复制到另一台电脑,导入镜像

 

sudo docker import dockdaata.tar ddata

 

创建容器nxxx运行该镜像

 sudo docker create -i -t --gpus all --name nxxx ddata /bin/bash