hugging选手llama 0724

Llama2-Chinese项目：1-项目介绍和模型推理

Atom-7B与Llama2间的关系：Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢？因为原子生万物，Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型，如下所示： FlagAlpha/Atom-7B FlagAlpha/Llama ......

项目 Llama2-Chinese 模型 Chinese Llama2更新时间 2023-10-01

Llama2-Chinese项目：2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍，但是中文预训练数据的比例依然非常少，仅占0.13%，这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力，可以采用微调和预训练两种路径，其中：微调需要的算力资源少，能够快速实现一个中文Llama的雏形。但缺点也显而易见， ......

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-10-01

Llama2-Chinese项目：2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱，一个中文汉子往往被切分成多个token，因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型，然后将中文tokenizer与LLaMA原生tokenizer进行合并，最终得到一个扩展后的tokenizer模型。国内Chinese ......

词表 Llama2-Chinese 模型 Chinese 语言更新时间 2023-10-01

Llama2-Chinese项目：3.1-全量参数微调

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式如下所示： "<s>Human: "+问题+"\n</s><s>Assistant: "+答案举个例子，如下所示： <s>Human: 用一句话描述地球为什么是独 ......

Llama2-Chinese 参数 Chinese 项目 Llama2更新时间 2023-10-01

LLaMA，LLaMA-2中的变化

LLaMA 预训练Token数量 1.4T CommonCrawl，C4：互联网网页 github：代码 wikipedia：百科 books，arxiv：书籍论文 StackExchange：科学问答 pre-norm + RMSNorm \(Pre Norm: x_{t+1}=x_t+F(Nor ......

LLaMA更新时间 2023-09-28

Hugging News #0925: 一览近期的新功能发布

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息，快来看看吧！ 🎉 近期更新 huggin ......

新功能一览 Hugging 0925 News更新时间 2023-09-27

基于SentencePiece扩充LLaMa中文词表

Sentencepiece是google开源的文本Tokenzier工具，其主要原理是利用统计算法，在语料库中生成一个类似分词器的工具，外加可以将词token化的功能；对比开源的分词器，它会将频繁出现的字符串作为词，然后形成词库进行切分，所以它会切分的粒度会更大些。当前各个大模型的分词器基本都是基于 ......

词表 SentencePiece LLaMa更新时间 2023-09-25

Llama2-Chinese项目：2.3-预训练使用QA还是Text数据集？

Llama2-Chinese项目给出pretrain的data为QA数据格式，可能会有疑问pretrain不应该是Text数据格式吗？而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术，给出pretrain的data为Text数据格式。所以推测应该pre ......

Llama2-Chinese Chinese 还是项目数据更新时间 2023-09-24

Hugging News #0918: Hub 加入分类整理功能、科普文本生成中的流式传输

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息，快来看看吧！ 🎉😍 🤗Hub 加入分 ......

科普文本 Hugging 功能 0918更新时间 2023-09-24

使用QLoRA对Llama 2进行微调的详细笔记

使用QLoRA对Llama 2进行微调是我们常用的一个方法，但是在微调时会遇到各种各样的问题，所以在本文中，将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的，大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。 https://avoid.overfit.cn/post/ ......

笔记 QLoRA Llama更新时间 2023-09-21

Hugging Face

什么是Hugging Face Hugging face 起初是一家总部位于纽约的聊天机器人初创服务商，他们本来打算创业做聊天机器人，然后在github上开源了一个Transformers库，虽然聊天机器人业务没搞起来，但是他们的这个库在机器学习社区迅速大火起来,变成了机器学习界的github，就像 ......

Hugging Face更新时间 2023-09-19

24届 CPP 菜鸡选手秋招 0 offer 记录

简历信息：绩点：年级前10%，专业课一半满绩点竞赛：ICPC/CCPC银，蓝桥杯C++ A组国一（都是大一打的）实习：阿里妈妈：内容不太多，但有一定工作量（cache 相关，偏底层，面试官一般不感兴趣，会问但往往不会深入问，导致看起来毫无难度）华为：比较水，主要是研究各种哈希表和实现无锁哈 ......

选手 offer CPP更新时间 2023-09-17

Llama2-Chinese项目：2.1-Atom-7B预训练

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-09-16

Llama2-Chinese项目：2.2-大语言模型词表扩充

词表 Llama2-Chinese 模型 Chinese 语言更新时间 2023-09-16

如何用华为云ModelArts平台玩转Llama2

本文分享自华为云社区《如何用华为云ModelArts平台玩转Llama2》，作者：码上开花_Lancer。天哪~~ Llama2模型开源了拉！！ Llama2不仅开源了预训练模型，而且还开源了利用对话数据SFT后的Llama2-Chat模型，并对Llama2-Chat模型的微调进行了详细的介绍。 ......

ModelArts Llama2 Llama 平台更新时间 2023-09-15

Llama2模型预训练，推理与微调测试

官方环境要求（推理、微调）：本次部署使用单卡A100-40G显卡。部署虚拟环境创建： conda create -n test python=3.10.9 conda activate test #启动虚拟环境拉取 Llama2-Chinese git clone https://githu ......

模型 Llama2 Llama更新时间 2023-09-14

OpenBuddy-LLaMA2-70B的三种部署方式

根据实际测试，加载模型需要130G显存，最低需要4张A100*40G显卡。 1.基于Transformers库推理：首先安装最新版本的transformers： git clone https://github.com/huggingface/transformers.git cd transfo ......

OpenBuddy-LLaMA OpenBuddy 方式 LLaMA 70更新时间 2023-09-14

Hugging News #0912: Hugging Face 2 人入选时代周刊全球百大 AI 人物

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息，快来看看吧！ 🎉😍 重磅更新 🤗 H ......

Hugging 时代周刊周刊人物时代更新时间 2023-09-13

DPO Llama

转：https://huggingface.co/blog/zh/dpo-trl 简介基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback，RLHF) 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步，它可以确保语言模 ......

Llama DPO更新时间 2023-09-13

Llama-2 推理和微调的硬件要求总结：RTX 3080 就可以微调最小模型

大语言模型微调是指对已经预训练的大型语言模型（例如Llama-2，Falcon等）进行额外的训练，以使其适应特定任务或领域的需求。微调通常需要大量的计算资源，但是通过量化和Lora等方法，我们也可以在消费级的GPU上来微调测试，但是消费级GPU也无法承载比较大的模型，经过我的测试，7B的模型可以在3 ......

模型硬件 Llama 3080 RTX更新时间 2023-09-13

1800亿参数，世界顶级开源大模型Falcon官宣！碾压LLaMA 2，性能直逼GPT-4

前言一经发布，地表最强开源模型Falcon 180B直接霸榜HF。3.5万亿token训练，性能直接碾压Llama 2。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部 ......

模型顶级性能参数 Falcon更新时间 2023-09-12

Llama2-Chinese项目：1-项目介绍和模型推理

Atom-7B与Llama2间的关系：Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢？因为原子生万物，Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型，如下所示： FlagAlpha/Atom-7BFlagAlpha/Llama2 ......

项目 Llama2-Chinese 模型 Chinese Llama2更新时间 2023-09-11

LLamaSharp - .NET Binding for llama.cpp

https://github.com/SciSharp/LLamaSharp The C#/.NET binding of llama.cpp. It provides APIs to inference the LLaMa Models and deploy it on local environ ......

LLamaSharp Binding llama NET for更新时间 2023-09-09

Code Llama：Llama 2 学会写代码了！

## 引言 Code Llama 是为代码类任务而生的一组最先进的、开放的 [Llama 2](https://huggingface.co/blog/zh/llama2) 模型，我们很高兴能将其集成入 Hugging Face 生态系统！Code Llama 使用与 Llama 2 相同的社区许可 ......

Llama 代码 Code更新时间 2023-09-07

重磅｜ Falcon 180B 正式在 Hugging Face Hub 上发布！

![](https://man-archives.oss-cn-hangzhou.aliyuncs.com/goofan/202309062046717.jpeg) ## 引言 **我们很高兴地宣布由 Technology Innovation Institute (TII) 训练的开源大模型 Fa ......

重磅 Hugging Falcon 180B Face更新时间 2023-09-06

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

> 本文是“在Serverless平台上构建AIGC应用”系列文章的第一篇文章。 ## **前言** 随着ChatGPT 以及 Stable Diffusion,Midjourney 这些新生代 AIGC 应用的兴起，围绕AIGC应用的相关开发变得越来越广泛，有呈井喷之势，从长远看这波应用的爆发不仅 ......

函数模型语言 Llama2 Llama更新时间 2023-09-06

Hugging News #0904：登陆 AWS Marketplace

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息，快来看看吧！ 🎉😍 ## 重磅更新 # ......

Marketplace Hugging 0904 News AWS更新时间 2023-09-05

Ziya-LLaMA-13B 模型在GPU 上部署

# Ziya-LLaMA-13B 模型在GPU 上部署 Ziya-LLaMA-13B是IDEA-CCNL基于LLaMa的130亿参数的大规模预训练模型，具备翻译，编程，文本分类，信息抽取，摘要，文案生成，常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习 ......

Ziya-LLaMA 模型 LLaMA Ziya GPU更新时间 2023-09-04

重要变更 | Hugging Face Hub 的 Git 操作不再支持使用密码验证

![](https://devrel.andfun.cn/devrel/posts/2023/08/31/8QmFnf.png) 在 Hugging Face，我们一直致力于提升服务安全性，因此，我们将对通过 Git 与 Hugging Face Hub 交互时的认证方式进行更改。从 **2023 ......

密码 Hugging Face Hub Git更新时间 2023-08-31

Hugging News #0821: Hugging Face 完成 2.35 亿美元 D 轮融资

Hugging 0821 Face 2.35 News更新时间 2023-08-28

共196篇 :3/7页 首页上一页123456下一页尾页