Llama2-526互联

Windows11下私有化部署大语言模型实战 langchain+llama2

一、本机环境 1.硬件环境： CPU：锐龙5600X 显卡：GTX3070 内存：32G 注：硬件配置仅为博主的配置，不是最低要求配置，也不是推荐配置。 2.软件环境： Windows系统版本：Win11专业版23H2 Python版本：3.11 Cuda版本：12.3.2 VS版本：VS2022 ......

实战 langchain 模型 Windows 语言更新时间 2024-01-07

使用双卡/8卡3090微调llama2-70B/13B模型

写在前面本篇博文将会教大家如何在消费级的设备（或者各种超级便宜的洋垃圾上）实现13B/70B等无法在单张消费级显卡上加载（但可以在一台机器上的多张卡上加载）的模型的微调。由于绝大部分做实验，仅要求实现推理，或者在微调时没有资源上到全量/13B+级别的真·大模型的微调，没有涉及到将一个模型放在多张 ......

模型 llama2 llama 3090 13更新时间 2023-12-10

使用8卡3090微调llama2-70B模型

写在前面很多问题尚未弄清，还在进一步调整目前已知我用8卡的3090 采用deepspeed ZeRO3进行运行，下面是deepspeed3的配置 1 { 2 "fp16": { 3 "enabled": "auto", 4 "loss_scale": 0, 5 "loss_scale_wind ......

模型 llama2 llama 3090 70更新时间 2023-12-08

8卡3090GPU云服务器上采用VLLM部署中文llama2-70b模型及OpenAI格式接口

TigerBot-70b-4k-v4 推理部署模型本地部署（基于HuggingFace) 根据实际测试，加载模型需要约129G显存，最低需要6张3090显卡（流水线并行）如果使用vllm进行加速推理（张量并行），考虑8张3090显卡或者4张A100-40G（模型分割要求）模型下载截至目前，模 ......

模型接口格式服务器 OpenAI更新时间 2023-12-07

medical custom dataset for fine-tuning llama2

data preparation we use huggingface shibin6624/medical to fine-tuning llama2, please note that this dataset is consist of en and cn data, here we just ......

fine-tuning medical dataset custom llama2更新时间 2023-11-29

cloudlflare推理llama2

title: cloudlflare推理llama2 banner_img: https://cdn.studyinglover.com/pic/2023/10/0863cb015e8d69fbce68ebe57bea96d8.jpg date: 2023-10-11 15:32:00 catego ......

cloudlflare llama2 llama更新时间 2023-11-26

快速上手llama2.c

title: 快速上手llama2.c banner_img: https://github.com/karpathy/llama2.c/blob/master/assets/llama_cute.jpg date: 2023-7-25 16:19:00 tags: - 踩坑快速上手llama2. ......

llama2 llama更新时间 2023-11-26

快速上手llama2.c(更新版)

title: 快速上手llama2.c(更新版) banner_img: https://github.com/karpathy/llama2.c/blob/master/assets/llama_cute.jpg date: 2023-7-28 16:31:00 tags: - 踩坑快速上手ll ......

llama2 llama更新时间 2023-11-26

全新Self-RAG框架亮相，自适应检索增强助力超越ChatGPT与Llama2，提升事实性与引用准确性

全新Self-RAG框架亮相，自适应检索增强助力超越ChatGPT与Llama2，提升事实性与引用准确性 1. 基本思想大型语言模型（LLMs）具有出色的能力，但由于完全依赖其内部的参数化知识，它们经常产生包含事实错误的回答，尤其在长尾知识中。为了解决这一问题，之前的研究人员提出了检索增强生成（ ......

事实性框架 Self-RAG 准确性事实更新时间 2023-11-23

通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测

引言 “克隆 dev 环境到 test 环境，等所有服务运行正常之后，把访问地址告诉我”，“检查所有项目，告诉我有哪些服务不正常，给出异常原因和修复建议”，在过去的工程师生涯中，也曾幻想过能够通过这样的自然语言指令来完成运维任务，如今 AI 助手 Appilot 利用 LLM 蕴藏的神奇力量，将这一 ......

文心 ChatGLM 能力 DevOps Llama2更新时间 2023-11-09

使用 Appilot 部署 Llama2，会聊天就行！

Walrus 是一款基于平台工程理念的应用管理平台，致力于解决应用交付领域的深切痛点。借助 Walrus 将云原生的能力和最佳实践扩展到非容器化环境，并支持任意应用形态统一编排部署，降低使用基础设施的复杂度，为研发和运维团队提供易用、一致的应用管理和部署体验，进而构建无缝协作的软件交付流程。在之前 ......

Appilot Llama2 Llama更新时间 2023-11-03

实战｜如何低成本训练一个可以超越 70B Llama2 的模型 Zephyr-7B

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。快来看看有哪些近期更新吧！ 🎉 新的训练方法 Zephyr-7B 模型超越 70B Lla ......

实战模型成本 Llama2 Zephyr更新时间 2023-10-28

开启中文智能之旅：探秘超乎想象的 Llama2-Chinese 大模型世界

“开启中文智能之旅：探秘超乎想象的 Llama2-Chinese 大模型世界” 1.国内Llama2最新下载地址本仓库中的代码示例主要是基于Hugging Face版本参数进行调用，我们提供了脚本将Meta官网发布的模型参数转换为Hugging Face支持的格式，可以直接通过transforme ......

Llama2-Chinese 模型 Chinese 之旅智能更新时间 2023-10-11

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

本篇教程先来分享一下第一个部分，如何通过函数计算快速部署 AIGC 相关模型服务包括 LLM 模型和 Embedding(Bert) 模型。 ......

函数模型语言 Llama2 Llama更新时间 2023-10-08

Llama2-Chinese项目：8-TRL资料整理

TRL（Transformer Reinforcement Learning）是一个使用强化学习来训练Transformer语言模型和Stable Diffusion模型的Python类库工具集，听上去很抽象，但如果说主要是做SFT（Supervised Fine-tuning）、RM（Reward ......

Llama2-Chinese Chinese 项目 Llama2 资料更新时间 2023-10-05

Llama2-Chinese项目：7-外延能力LangChain集成

本文介绍了Llama2模型集成LangChain框架的具体实现，这样可更方便地基于Llama2开发文档检索、问答机器人和智能体应用等。 1.调用Llama2类针对LangChain[1]框架封装的Llama2 LLM类见examples/llama2_for_langchain.py，调用代码如下 ......

外延 Llama2-Chinese LangChain Chinese 能力更新时间 2023-10-05

Llama2-Chinese项目：4-量化模型

一.量化模型调用方式下面是一个调用FlagAlpha/Llama2-Chinese-13b-Chat[1]的4bit压缩版本FlagAlpha/Llama2-Chinese-13b-Chat-4bit[2]的例子： from transformers import AutoTokenizerfro ......

Llama2-Chinese 模型 Chinese 项目 Llama2更新时间 2023-10-05

Llama2-Chinese项目：5-推理加速

随着大模型参数规模的不断增长，在有限的算力资源下，提升模型的推理速度逐渐变为一个重要的研究方向。常用的推理加速框架包含lmdeploy、FasterTransformer和vLLM等。一.lmdeploy推理部署 lmdeploy由上海人工智能实验室开发，推理使用C++/CUDA，对外提供pyth ......

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-10-05

Llama2-Chinese项目：6-模型评测

测试问题筛选自AtomBulb[1]，共95个测试问题，包含：通用知识、语言理解、创作能力、逻辑推理、代码编程、工作技能、使用工具、人格特征八个大的类别。 1.测试中的Prompt 例如对于问题"列出5种可以改善睡眠质量的方法"，如下所示： [INST] <<SYS>>You are a helpf ......

Llama2-Chinese 模型 Chinese 项目 Llama2更新时间 2023-10-05

Llama2-Chinese项目：3.2-LoRA微调和模型量化

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式为"<s>Human: "+问题+"\n</s><s>Assistant: "+答案。本文主要介绍Llama-2-7b模型LoRA微调以及4bit量化的实践过程。 ......

Llama2-Chinese 模型 Chinese 项目 Llama2更新时间 2023-10-01

Llama2-Chinese项目：2.3-预训练使用QA还是Text数据集？

Llama2-Chinese项目给出pretrain的data为QA数据格式，可能会有疑问pretrain不应该是Text数据格式吗？而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术，给出pretrain的data为Text数据格式。所以推测应该pre ......

Llama2-Chinese Chinese 还是项目数据更新时间 2023-10-01

Llama2-Chinese项目：3.1-全量参数微调

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式如下所示： "<s>Human: "+问题+"\n</s><s>Assistant: "+答案举个例子，如下所示： <s>Human: 用一句话描述地球为什么是独 ......

Llama2-Chinese 参数 Chinese 项目 Llama2更新时间 2023-10-01

Llama2-Chinese项目：1-项目介绍和模型推理

Atom-7B与Llama2间的关系：Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢？因为原子生万物，Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型，如下所示： FlagAlpha/Atom-7B FlagAlpha/Llama ......

项目 Llama2-Chinese 模型 Chinese Llama2更新时间 2023-10-01

Llama2-Chinese项目：2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍，但是中文预训练数据的比例依然非常少，仅占0.13%，这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力，可以采用微调和预训练两种路径，其中：微调需要的算力资源少，能够快速实现一个中文Llama的雏形。但缺点也显而易见， ......

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-10-01

Llama2-Chinese项目：2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱，一个中文汉子往往被切分成多个token，因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型，然后将中文tokenizer与LLaMA原生tokenizer进行合并，最终得到一个扩展后的tokenizer模型。国内Chinese ......

词表 Llama2-Chinese 模型 Chinese 语言更新时间 2023-10-01

Llama2-Chinese项目：3.1-全量参数微调

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式如下所示： "<s>Human: "+问题+"\n</s><s>Assistant: "+答案举个例子，如下所示： <s>Human: 用一句话描述地球为什么是独 ......

Llama2-Chinese 参数 Chinese 项目 Llama2更新时间 2023-10-01

Llama2-Chinese项目：2.3-预训练使用QA还是Text数据集？

Llama2-Chinese项目给出pretrain的data为QA数据格式，可能会有疑问pretrain不应该是Text数据格式吗？而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术，给出pretrain的data为Text数据格式。所以推测应该pre ......

Llama2-Chinese Chinese 还是项目数据更新时间 2023-09-24

Llama2-Chinese项目：2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍，但是中文预训练数据的比例依然非常少，仅占0.13%，这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力，可以采用微调和预训练两种路径，其中：微调需要的算力资源少，能够快速实现一个中文Llama的雏形。但缺点也显而易见， ......

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-09-16

Llama2-Chinese项目：2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱，一个中文汉子往往被切分成多个token，因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型，然后将中文tokenizer与LLaMA原生tokenizer进行合并，最终得到一个扩展后的tokenizer模型。国内Chinese ......

词表 Llama2-Chinese 模型 Chinese 语言更新时间 2023-09-16

如何用华为云ModelArts平台玩转Llama2

本文分享自华为云社区《如何用华为云ModelArts平台玩转Llama2》，作者：码上开花_Lancer。天哪~~ Llama2模型开源了拉！！ Llama2不仅开源了预训练模型，而且还开源了利用对话数据SFT后的Llama2-Chat模型，并对Llama2-Chat模型的微调进行了详细的介绍。 ......

ModelArts Llama2 Llama 平台更新时间 2023-09-15