langchain llama2 llama ggml

Llama2-Chinese项目：3.1-全量参数微调

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式如下所示： "<s>Human: "+问题+"\n</s><s>Assistant: "+答案举个例子，如下所示： <s>Human: 用一句话描述地球为什么是独 ......

Llama2-Chinese 参数 Chinese 项目 Llama2更新时间 2023-10-01

Llama2-Chinese项目：1-项目介绍和模型推理

Atom-7B与Llama2间的关系：Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢？因为原子生万物，Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型，如下所示： FlagAlpha/Atom-7B FlagAlpha/Llama ......

项目 Llama2-Chinese 模型 Chinese Llama2更新时间 2023-10-01

Llama2-Chinese项目：2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍，但是中文预训练数据的比例依然非常少，仅占0.13%，这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力，可以采用微调和预训练两种路径，其中：微调需要的算力资源少，能够快速实现一个中文Llama的雏形。但缺点也显而易见， ......

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-10-01

Llama2-Chinese项目：2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱，一个中文汉子往往被切分成多个token，因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型，然后将中文tokenizer与LLaMA原生tokenizer进行合并，最终得到一个扩展后的tokenizer模型。国内Chinese ......

词表 Llama2-Chinese 模型 Chinese 语言更新时间 2023-10-01

Llama2-Chinese项目：3.1-全量参数微调

Llama2-Chinese 参数 Chinese 项目 Llama2更新时间 2023-10-01

LLaMA，LLaMA-2中的变化

LLaMA 预训练Token数量 1.4T CommonCrawl，C4：互联网网页 github：代码 wikipedia：百科 books，arxiv：书籍论文 StackExchange：科学问答 pre-norm + RMSNorm \(Pre Norm: x_{t+1}=x_t+F(Nor ......

LLaMA更新时间 2023-09-28

本地部署 Langchain-Chatchat & ChatGLM

一、模型&环境介绍 1. ChatGLM github 地址：https://github.com/THUDM 模型地址：https://huggingface.co/THUDM 2. m3e 模型地址：https://huggingface.co/moka-ai/m3e-base/ 3. text ......

Langchain-Chatchat Langchain Chatchat ChatGLM amp更新时间 2023-09-26

基于SentencePiece扩充LLaMa中文词表

Sentencepiece是google开源的文本Tokenzier工具，其主要原理是利用统计算法，在语料库中生成一个类似分词器的工具，外加可以将词token化的功能；对比开源的分词器，它会将频繁出现的字符串作为词，然后形成词库进行切分，所以它会切分的粒度会更大些。当前各个大模型的分词器基本都是基于 ......

词表 SentencePiece LLaMa更新时间 2023-09-25

Llama2-Chinese项目：2.3-预训练使用QA还是Text数据集？

Llama2-Chinese项目给出pretrain的data为QA数据格式，可能会有疑问pretrain不应该是Text数据格式吗？而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术，给出pretrain的data为Text数据格式。所以推测应该pre ......

Llama2-Chinese Chinese 还是项目数据更新时间 2023-09-24

LangChain使用fine-tuned GPT-3.5

LangChain使用fine-tuned GPT-3.5 参考： https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates https://platform.openai.com/docs/guides/fine-tunin ......

fine-tuned LangChain tuned fine GPT更新时间 2023-09-24

使用QLoRA对Llama 2进行微调的详细笔记

使用QLoRA对Llama 2进行微调是我们常用的一个方法，但是在微调时会遇到各种各样的问题，所以在本文中，将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的，大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。 https://avoid.overfit.cn/post/ ......

笔记 QLoRA Llama更新时间 2023-09-21

Llama2-Chinese项目：2.1-Atom-7B预训练

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-09-16

Llama2-Chinese项目：2.2-大语言模型词表扩充

词表 Llama2-Chinese 模型 Chinese 语言更新时间 2023-09-16

GPT之路(八) LangChain - Models入门

环境：Python 3.11.4， LangChain 0.0.270, Jupyter Models模型简介官方地址：LangChian - Models Langchain所封装的模型分为两类：大语言模型 (LLM) 聊天模型 (Chat Models) Langchain的支持众多模型供应 ......

LangChain Models GPT更新时间 2023-09-16

如何用华为云ModelArts平台玩转Llama2

本文分享自华为云社区《如何用华为云ModelArts平台玩转Llama2》，作者：码上开花_Lancer。天哪~~ Llama2模型开源了拉！！ Llama2不仅开源了预训练模型，而且还开源了利用对话数据SFT后的Llama2-Chat模型，并对Llama2-Chat模型的微调进行了详细的介绍。 ......

ModelArts Llama2 Llama 平台更新时间 2023-09-15

安装langchain-chatchat

1、下载langchain-chatchat git clone https://github.com/chatchat-space/Langchain-Chatchat.git 2、下载llama2-7b-chat-hf git lfs installgit clone https://huggi ......

langchain-chatchat langchain chatchat更新时间 2023-09-14

Llama2模型预训练，推理与微调测试

官方环境要求（推理、微调）：本次部署使用单卡A100-40G显卡。部署虚拟环境创建： conda create -n test python=3.10.9 conda activate test #启动虚拟环境拉取 Llama2-Chinese git clone https://githu ......

模型 Llama2 Llama更新时间 2023-09-14

OpenBuddy-LLaMA2-70B的三种部署方式

根据实际测试，加载模型需要130G显存，最低需要4张A100*40G显卡。 1.基于Transformers库推理：首先安装最新版本的transformers： git clone https://github.com/huggingface/transformers.git cd transfo ......

OpenBuddy-LLaMA OpenBuddy 方式 LLaMA 70更新时间 2023-09-14

DPO Llama

转：https://huggingface.co/blog/zh/dpo-trl 简介基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback，RLHF) 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步，它可以确保语言模 ......

Llama DPO更新时间 2023-09-13

Llama-2 推理和微调的硬件要求总结：RTX 3080 就可以微调最小模型

大语言模型微调是指对已经预训练的大型语言模型（例如Llama-2，Falcon等）进行额外的训练，以使其适应特定任务或领域的需求。微调通常需要大量的计算资源，但是通过量化和Lora等方法，我们也可以在消费级的GPU上来微调测试，但是消费级GPU也无法承载比较大的模型，经过我的测试，7B的模型可以在3 ......

模型硬件 Llama 3080 RTX更新时间 2023-09-13

1800亿参数，世界顶级开源大模型Falcon官宣！碾压LLaMA 2，性能直逼GPT-4

前言一经发布，地表最强开源模型Falcon 180B直接霸榜HF。3.5万亿token训练，性能直接碾压Llama 2。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部 ......

模型顶级性能参数 Falcon更新时间 2023-09-12

Javascript版Langchain入门

https://baijiahao.baidu.com/s?id=1769509377621631060&wfr=spider&for=pc 介绍 LangChain是一个开源Python库，用于构建由大型语言模型（LLM）支持的应用程序。它提供了一个框架，将LLM与其他数据源（如互联网或个人文件） ......

Javascript Langchain更新时间 2023-09-11

Llama2-Chinese项目：1-项目介绍和模型推理

Atom-7B与Llama2间的关系：Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢？因为原子生万物，Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型，如下所示： FlagAlpha/Atom-7BFlagAlpha/Llama2 ......

项目 Llama2-Chinese 模型 Chinese Llama2更新时间 2023-09-11

Langchain的一些问题和替代选择

Langchain因其简化大型语言模型(llm)的交互方面的到关注。凭借其高级的API可以简化将llm集成到各种应用程序中的过程。但是Langchain乍一看似乎是一个方便的工具，但是它有时候否更像是一个语言迷宫，而不是一个直截了当的解决方案。在本文中，我们将探讨与Langchain相关的一些问题 ......

Langchain 问题更新时间 2023-09-10

GPT之路(七) LangChain AI编成框架入门的第一个demo

环境：Python 3.11.4， LangChain 0.0.270 1.Langchain 简介 1.1 Python Langchain官方文档大型语言模型（LLM）正在成为一种具有变革性的技术，使开发人员能够构建以前无法实现的应用程序。然而，仅仅依靠LLM还不足以创建一个真正强大的应用程序 ......

LangChain 框架 demo GPT更新时间 2023-09-10

LLamaSharp - .NET Binding for llama.cpp

https://github.com/SciSharp/LLamaSharp The C#/.NET binding of llama.cpp. It provides APIs to inference the LLaMa Models and deploy it on local environ ......

LLamaSharp Binding llama NET for更新时间 2023-09-09

Code Llama：Llama 2 学会写代码了！

## 引言 Code Llama 是为代码类任务而生的一组最先进的、开放的 [Llama 2](https://huggingface.co/blog/zh/llama2) 模型，我们很高兴能将其集成入 Hugging Face 生态系统！Code Llama 使用与 Llama 2 相同的社区许可 ......

Llama 代码 Code更新时间 2023-09-07

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

> 本文是“在Serverless平台上构建AIGC应用”系列文章的第一篇文章。 ## **前言** 随着ChatGPT 以及 Stable Diffusion,Midjourney 这些新生代 AIGC 应用的兴起，围绕AIGC应用的相关开发变得越来越广泛，有呈井喷之势，从长远看这波应用的爆发不仅 ......

函数模型语言 Llama2 Llama更新时间 2023-09-06

Ziya-LLaMA-13B 模型在GPU 上部署

# Ziya-LLaMA-13B 模型在GPU 上部署 Ziya-LLaMA-13B是IDEA-CCNL基于LLaMa的130亿参数的大规模预训练模型，具备翻译，编程，文本分类，信息抽取，摘要，文案生成，常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习 ......

Ziya-LLaMA 模型 LLaMA Ziya GPU更新时间 2023-09-04

Chat.langchain

Chat LangChain 代码： langchain-ai/chat-langchain (github.com) import argparse import functools import os from typing import Literal, Optional, Union fro ......

langchain Chat更新时间 2023-08-31

共260篇 :4/9页 首页上一页1234567下一页尾页