7b

使用Mixtral-offloading在消费级硬件上运行Mixtral-8x7B

Mixtral-8x7B是最好的开放大型语言模型(LLM)之一，但它是一个具有46.7B参数的庞大模型。即使量化为4位，该模型也无法在消费级GPU上完全加载(例如，24 GB VRAM是不够的)。 Mixtral-8x7B是混合专家(MoE)。它由8个专家子网组成，每个子网有60亿个参数。8位专家中 ......

Mixtral Mixtral-offloading offloading 硬件 8x更新时间 2024-01-13

微调baichuan2-7b遇到的显存坑

问题描述：微调baichuan2-7b模型，验证一轮后继续训练第一个iteration显存大幅增加项目链接： https://github.com/wp931120/baichuan_sft_lora 具体描述：由于某些原因，笔者是在transformers4.30.2、torch2.0.1， ......

显存 baichuan2 baichuan 7b更新时间 2023-12-19

PTA-ch7b-5 : 最小工期

最小工期一个项目由若干个任务组成，任务之间有先后依赖顺序。项目经理需要设置一系列里程碑，在每个里程碑节点处检查任务的完成情况，并启动后续的任务。现给定一个项目中各个任务之间的关系，请你计算出这个项目的最早完工时间。输入格式：首先第一行给出两个正整数：项目里程碑的数量 N（≤100）和任务总数 ......

工期 PTA-ch PTA 7b ch更新时间 2023-11-26

huggingface_hub.utils._validators.HFValidationError: Repo id must be in the form 'repo_name' or 'namespace/repo_name': '/llama-2-7b-chat-hf-chinese/1.1'. Use `repo_type` argument if needed.

repo_name 39 repo 7b-chat-hf-chinese HFValidationError更新时间 2023-11-26

开源模型 Zephyr-7B 发布——跨越三大洲的合作

最近我们刚刚发布了新的开源模型 Zephry-7B🪁，这个模型的诞生离不开全球三大洲开源社区的协作 ❤️。我们的 CSO Thomas 录了一个视频介绍了它的起源故事: ✨ 就在几个月前，巴黎的一个新团队发布了他们首个模型: Mistral 7B，这个模型体积小巧但性能强劲，在基准测试中的表现超 ......

模型三大 Zephyr 7B更新时间 2023-11-09

实战｜如何低成本训练一个可以超越 70B Llama2 的模型 Zephyr-7B

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。快来看看有哪些近期更新吧！ 🎉 新的训练方法 Zephyr-7B 模型超越 70B Lla ......

实战模型成本 Llama2 Zephyr更新时间 2023-10-28

LLM实践-在Colab上使用免费T4 GPU进行Chinese-Llama-2-7b-4bit推理

一、配置环境 1、打开colab，创建一个空白notebook，在[修改运行时环境]中选择15GB显存的T4 GPU. 2、pip安装依赖python包 !pip install --upgrade accelerate !pip install bitsandbytes transformers_ ......

Chinese-Llama Chinese Colab Llama 4bit更新时间 2023-10-06

Llama2-Chinese项目：2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍，但是中文预训练数据的比例依然非常少，仅占0.13%，这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力，可以采用微调和预训练两种路径，其中：微调需要的算力资源少，能够快速实现一个中文Llama的雏形。但缺点也显而易见， ......

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-10-01

Falcon-7B大型语言模型在心理健康对话数据集上使用QLoRA进行微调

文本是参考文献[1]的中文翻译，主要讲解了Falcon-7B大型语言模型在心理健康对话数据集上使用QLoRA进行微调的过程。项目GitHub链接为https://github.com/iamarunbrahma/finetuned-qlora-falcon7b-medical，如下所示：使用领域适 ......

心理健康模型语言心理数据更新时间 2023-09-18

Llama2-Chinese项目：2.1-Atom-7B预训练

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-09-16

利用text-generation-webui快速搭建chatGLM2-6b/LLAMA2-7B-chat大模型运行环境

text-generation-webui 是一个基于Gradio的LLM Web UI开源项目，可以利用其快速搭建各种文本生成的大模型环境。一、安装 text-generation-webui的readme其实已写得相当详细了，这里就不再重复，只说1个可能存在的坑：安装 peft 安装卡住 r ......

text-generation-webui generation chatGLM2 模型 chatGLM更新时间 2023-08-19

【必看！】阿里云推出QWen-7B和QWen-7b-Chat，开放免费商用！

阿里云最近发布了两款大型开源模型QWen-7B和QWen-7b-Chat，这两款模型的参数规模达到了70亿，用户可以在Hugging Face和ModelScope上免费使用。尽管大型模型的热度近期有所下降，但阿里云选择开源模型来赢得用户的支持，并保持自身在竞争中的优势。这一举措也引起了人们的关注，... ......

QWen 商用 7b-Chat Chat 7B更新时间 2023-08-07

在矩池云使用Llama2-7B的方法

今天给大家分享如何在矩池云服务器使用 Llama2-7b模型。 ## **硬件要求** 矩池云已经配置好了 Llama 2 Web UI 环境，显存需要大于 8G，可以选择 A4000、P100、3090 以及更高配置的等显卡。 ### 租用机器在矩池云主机市场：https://matpool.c ......

方法 Llama2 Llama 7B更新时间 2023-08-01

[llama懒人包]ChatGPT本地下位替代llama-7b，支持全平台显卡/CPU运行

LLAMA的懒人包：链接： https://pan.baidu.com/s/1xOw8-eP8QB--u6y644_UPg?pwd=0l08 提取码：0l08 模型来源：elinas/llama-7b-hf-transformers-4.29 模型来源（LoRA）：ymcui/Chinese-LL ......

llama 懒人显卡 ChatGPT 平台更新时间 2023-07-05

微调7B模型只用单GPU！通用多模态工具LLaMA-Adapter拆掉门槛，效果惊人

前言开源万能模型微调工具LLaMA-Adapter发布，支持多模态输入输出。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈 ......

模态 LLaMA-Adapter 门槛模型效果更新时间 2023-06-29

LCD多键触摸驱动IC芯片VK36N3B/4B/5B/6B/7B/8B技术资料

型号汇总：VK36N3B-8B按键数不同，分别对应3-8个触摸按键 VK36N3B封装为sop8,VK36N4-8B为sop16,VK36N3B/4B为2位BCD码输出,VK36N5B-8B为3位BCD码输出。概述：VK36N3B 具有3个触摸按键，可用来检测外部触摸按键上人手的触摸动作。该芯片具有 ......

技术资料芯片资料技术 LCD更新时间 2023-06-28

Hugging News #0626: 音频课程更新、在线体验 baichuan-7B 模型、ChatGLM2-6B 重磅发

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」，本期 Hugging News 有哪些有趣的消息，快来看看吧！ ## 重要更新 ### 最新 ......

重磅 ChatGLM2 baichuan 模型音频更新时间 2023-06-26

未能加载文件或程序集“netstandard,Version=2.0.0.0, Culture=neutral,PublicKeyToken=cc7b13ffcd2ddd51”或它的某一个依赖项解决

未能加载文件或程序集“netstandard,Version=2.0.0.0, Culture=neutral,PublicKeyToken=cc7b13ffcd2ddd51”或它的某一个依赖项错误环境: win7 sp1 ,winform 基于.net framework 4.5开发的程序,调用 ......

PublicKeyToken netstandard ffcd2ddd Version Culture更新时间 2023-05-08

大模型入门（三）—— 单张A100微调LLAMA-7B

单张V100的GPU内存只有16G，LLAMA-7B模型大小就有约27G，在单张16G的V100上微调LLAMA-7B呢？这里需要用到几个技巧：1）lora微调；2）混合精度训练；3）梯度累积。目前github上已经有不少用lora微调llama的代码，但基本都是完全基于hugging face的库 ......

模型 LLAMA A100 100 7B更新时间 2023-04-18

共19篇 :1/1页 首页上一页1下一页尾页