LXD
关于LXD容器出现OOM错误,以及添加内存条后容器无法启动的解决
目前实验室的GPU服务器有4张3090显卡,但是只有32GB内存,频繁出现OOM(Out Of Memory)错误,因此博主通过添加大swap文件暂时缓解该问题,并采购内存条以解决该问题,同时解决添加内存条后lxc报错的问题。 ......
基于LXD搭建实验室GPU服务器(四)——LXD部署
在之前的文章中,我们完成了宿主机的配置,接下来将进行LXD的部署。
在实验室环境下,多人共用GPU服务器,由于大家所需的系统环境可能不同,一个用户修改系统文件会影响其它用户,甚至会有小白胡乱修改文件导致服务器崩溃的可能。我们可以通过不给sudo权限来减轻这个问题,但是这不仅对用户来说不方便,也大大增... ......
基于LXD搭建实验室GPU服务器(三)——配置frp网穿并注册服务
在之前博客中,我们对宿主机进行了基本配置和基本深度学习环境的配置,在本文中,我们将介绍如何对服务器进行frp网穿,本文的内容可用于后续的lxd容器中,实现每个容器皆可使用公网ip访问。
若不需要配置网穿,则可以跳过此文。
配置网穿可以在局域网外访问服务器,我们需要一台具有公网ip的服务器。 ......
基于LXD搭建实验室GPU服务器(二)——宿主机的深度学习环境安装
在上一篇博客中,我们介绍了服务器的基本配置,例如换源、sshd配置、防火墙配置等。
在本文中,我们将继续介绍如何在宿主机配置基本的深度学习环境,包括nvidia驱动,cuda,anaconda,torch等。 ......
基于LXD搭建实验室GPU服务器(一)——宿主机的基本配置
从零搭建服务器是一个看似简单实则有些繁琐的操作,本文旨在记录并整合这些操作,使得后续搭建可以成为一个流水线般简单流程的过程。
操作系统的安装过程网络上资源非常多,本文不再赘述。
本文将对刚安装的ubuntu20.04.06操作系统进行基本配置。 ......