deepspeed

使用docker搭建deepspeed多机多卡分布式微调大模型环境

前置环境：两台可以互通的centos服务器（服务器1、服务器2），docker，NVIDIA驱动 docker创建overlay共享网络 1）选用服务器1作为manage节点进行初始化，执行docker swarm init Swarm initialized: current node (ly4d ......

分布式 deepspeed 模型环境 docker更新时间 2024-01-08

DeepSpeed 学习 [2]: 从 0 开始 DeepSpeed 实战

从 0 开始 DeepSpeed 实战，Get Start 目录从 0 开始 DeepSpeed 实战，Get StartDDP 初探Minimum DDP ExampleMULTI GPU TRAINING WITH DDP (Single to Multi)Install初始化TrainingM ......

DeepSpeed 实战更新时间 2024-01-01

DeepSpeed分布式训练

一、DeepSpeed 总纲官方文档：DeepSpeed 官方英文文档 cpoy下来的原版 DeepSpeed 模型的训练是使用DeeSpeed引擎完成的 DeepSpeed引擎可以包装任何 torch.nn.module 类型的模型二、训练 1、通过 deepspeed.initialize ......

分布式 DeepSpeed更新时间 2023-12-20

安装 deepspeed 报错 | 【CUDA_HOME does not exist, unable to compile CUDA op(s)】

原因是因为 deepspeed 需要安装 cuda toolkit (runtime cuda), 不能使用 torch 内置的 cuda toolkit。安装完成之后使用 nvcc -V，输出版本则证明安装cuda toolkit 成功。参考：[https://github.com/micr ......

CUDA deepspeed CUDA_HOME compile unable更新时间 2023-12-20

【LLMOps】Accelerate & DeepSpeed多卡使用

介绍目前大模型微调主要方案是 LLaMA-Factory LLaMA-Factory中，提供了两种多卡框架：Accelerate、DeepSpeed Accelerate 依赖 accelerate==0.24.1transformers==4.34.1datasets==2.14.7tiktok ......

Accelerate DeepSpeed LLMOps amp更新时间 2023-12-12

LLM 学习笔记-Deepspeed-MoE 论文

论文 DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale 1. Introduction 现有的 MoE 方法在正式使用场景中存在的挑战：场景局限： ......

Deepspeed-MoE Deepspeed 笔记论文 LLM更新时间 2023-12-07

在Megatron-Deepspeed项目中如何下载和预处理Wikipedia数据集

更详细的查看 https://github.com/marsggbo/Megatron-DeepSpeed/blob/main/tutorials/gpt2_wikipedia.md 下载Wikipedia压缩数据集（enwiki-latest-pages-articles.xml.bz2）再使用 ......

Megatron-Deepspeed Deepspeed Wikipedia Megatron 项目更新时间 2023-11-26

DeepSpeed：大模型训练框架

目前，大模型的发展已经非常火热，关于大模型的训练、微调也是各个公司重点关注方向。但是大模型训练的痛点是模型参数过大，动辄上百亿，如果单靠单个GPU来完成训练基本不可能。所以需要多卡或者分布式训练来完成这项工作。 ......

DeepSpeed 框架模型更新时间 2023-10-26

DeepSpeed框架：1-大纲和资料梳理

DeepSpeed是一个深度学习优化软件套件，使分布式训练和推理变得简单、高效和有效。它可以做些什么呢？训练/推理具有数十亿或数万亿参数的密集或稀疏模型；实现出色的系统吞吐量并有效扩展到数千个GPU；在资源受限的GPU系统上进行训练/推理；实现前所未有的低延迟和高吞吐量的推理；以低成本实现极限压缩， ......

大纲 DeepSpeed 框架资料更新时间 2023-10-12

大模型训练框架deepspeed和accelerate

引子 DeepSpeed是由Microsoft提供的分布式训练工具，旨在支持更大规模的模型和提供更多的优化策略和工具。与其他框架相比，DeepSpeed支持更大规模的模型和提供更多的优化策略和工具。其中，主要优势在于支持更大规模的模型、提供了更多的优化策略和工具（例如 ZeRO 和 Offload ......

accelerate deepspeed 框架模型更新时间 2023-08-30

deepspeed流水线并行

docs/_tutorials/pipeline.md https://gitee.com/qzl66/DeepSpeed/blob/master/docs/_tutorials/pipeline.md 1、重构管道模型 Expressing Pipeline Models 流水线并行要求模型被表示 ......

流水线 deepspeed 流水更新时间 2023-08-28

开源大模型训练框架 colossal AI chat 、 DeepSpeed chat

Colossal-AI是一个专注于大规模模型训练的深度学习系统，Colossal-AI基于PyTorch开发，旨在支持完整的高性能分布式训练生态。Colossal-AI已在GitHub上开源。在Colossal-AI中，我们支持了不同的分布式加速方式，包括张量并行、流水线并行、零冗余数据并行、异构 ......

chat DeepSpeed 框架 colossal 模型更新时间 2023-08-03

DeepSpeed-MoE:训练更大及更复杂的混合专家网络

这是微软发布在2022 ICML的论文，MoE可以降低训练成本，但是快速的MoE模型推理仍然是一个未解决的问题。所以论文提出了一个端到端的MoE训练和推理解决方案DeepSpeed-MoE：它包括新颖的MoE架构设计和模型压缩技术，可将MoE模型大小减少3.7倍；通过高度优化的推理系统，减少了7.3 ......

DeepSpeed-MoE DeepSpeed 专家网络 MoE更新时间 2023-07-27

DeepSpeed + Kubernetes 如何轻松落地大规模分布式训练

随着 ChatGPT 的广泛应用，各种大规模语言模型层出不穷，其中包括 EleutherAI 推出的 200 亿参数的 GPT-NeoX-20B 和 BigScience 发布的 1760 亿参数的 Bloom 模型。 ......

分布式 Kubernetes DeepSpeed 大规模更新时间 2023-06-29

DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍

DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍 1. 概述近日来，ChatGPT及类似模型引发了人工智能（AI）领域的一场风潮。这场风潮对数字世界产生了革命性影响。ChatGPT类模型具有惊人的泛用性，能够执行归纳、编程、翻译等任务，其结果与人 ......

DeepSpeed 模型 ChatGPT Chat RLHF更新时间 2023-04-19

微软开源DeepSpeed

人手一个ChatGPT的梦想，就要实现了？刚刚，微软开源了一个可以在模型训练中加入完整RLHF流程的系统框架——DeepSpeed Chat。也就是说，各种规模的高质量类ChatGPT模型，现在都唾手可得了！项目地址：https://github.com/microsoft/DeepSpeed ......

DeepSpeed更新时间 2023-04-13

安装TensorNVMe和Deepspeed时遇到的坑：无root权限安装libaio依赖库

如果你有root权限，用下面这行代码一键安装即可： sudo apt install libaio1 libaio-dev 如果没有root权限，步骤如下下载 libaio git clone https://pagure.io/libaio 安装libaio 如果你没有 cd libaio ma ......

TensorNVMe Deepspeed 权限 libaio root更新时间 2023-03-22

使用 DeepSpeed 和 Hugging Face 🤗 Transformer 微调 FLAN-T5 XL/XXL

Scaling Instruction-Finetuned Language Models 论文发布了 FLAN-T5 模型，它是 T5 模型的增强版。FLAN-T5 由很多各种各样的任务微调而得，因此，简单来讲，它就是个方方面面都更优的 T5 模型。相同参数量的条件下，FLAN-T5 的性能相比 ......

Transformer DeepSpeed Hugging 129303 FLAN-T更新时间 2023-03-22

共18篇 :1/1页 首页上一页1下一页尾页