外延llama2-chinese langchain chinese-第3页-526互联

Langchain-Chatchat项目：1.2-Baichuan2项目整体介绍

由百川智能推出的新一代开源大语言模型，采用2.6万亿Tokens的高质量语料训练，在多个权威的中文、英文和多语言的通用、领域benchmark上取得同尺寸最佳的效果，发布包含有7B、13B的Base和经过PPO训练的Chat版本，并提供了Chat版本的4bits量化。一.Baichuan2模型 B ......

项目 Langchain-Chatchat Langchain Baichuan2 Chatchat更新时间 2023-10-07

Langchain-Chatchat项目：2.1-通过GPT2模型来检索NebulaGraph

在官方例子中给出了通过chain = NebulaGraphQAChain.from_llm(ChatOpenAI(temperature=0), graph=graph, verbose=True)来检索NebulaGraph图数据库。本文介绍了通过GPT2替换ChatOpenAI的思路和实现，暂 ......

Langchain-Chatchat NebulaGraph Langchain Chatchat 模型更新时间 2023-10-07

LLM实践-在Colab上使用免费T4 GPU进行Chinese-Llama-2-7b-4bit推理

一、配置环境 1、打开colab，创建一个空白notebook，在[修改运行时环境]中选择15GB显存的T4 GPU. 2、pip安装依赖python包 !pip install --upgrade accelerate !pip install bitsandbytes transformers_ ......

Chinese-Llama Chinese Colab Llama 4bit更新时间 2023-10-06

GPT之路(九) LangChain - Memory

记忆封装 - Memory (langchain memory) Memory：这里不是物理内存，从文本的角度，可以理解为“上文”、“历史记录”或者说“记忆力”的管理 ConversationBufferMemory可也用来保留会话信息 In [ ]: from langchain.memory i ......

LangChain Memory GPT更新时间 2023-10-06

Llama2-Chinese项目：7-外延能力LangChain集成

本文介绍了Llama2模型集成LangChain框架的具体实现，这样可更方便地基于Llama2开发文档检索、问答机器人和智能体应用等。 1.调用Llama2类针对LangChain[1]框架封装的Llama2 LLM类见examples/llama2_for_langchain.py，调用代码如下 ......

外延 Llama2-Chinese LangChain Chinese 能力更新时间 2023-10-05

Llama2-Chinese项目：8-TRL资料整理

TRL（Transformer Reinforcement Learning）是一个使用强化学习来训练Transformer语言模型和Stable Diffusion模型的Python类库工具集，听上去很抽象，但如果说主要是做SFT（Supervised Fine-tuning）、RM（Reward ......

Llama2-Chinese Chinese 项目 Llama2 资料更新时间 2023-10-05

Llama2-Chinese项目：4-量化模型

一.量化模型调用方式下面是一个调用FlagAlpha/Llama2-Chinese-13b-Chat[1]的4bit压缩版本FlagAlpha/Llama2-Chinese-13b-Chat-4bit[2]的例子： from transformers import AutoTokenizerfro ......

Llama2-Chinese 模型 Chinese 项目 Llama2更新时间 2023-10-05

Llama2-Chinese项目：5-推理加速

随着大模型参数规模的不断增长，在有限的算力资源下，提升模型的推理速度逐渐变为一个重要的研究方向。常用的推理加速框架包含lmdeploy、FasterTransformer和vLLM等。一.lmdeploy推理部署 lmdeploy由上海人工智能实验室开发，推理使用C++/CUDA，对外提供pyth ......

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-10-05

Llama2-Chinese项目：6-模型评测

测试问题筛选自AtomBulb[1]，共95个测试问题，包含：通用知识、语言理解、创作能力、逻辑推理、代码编程、工作技能、使用工具、人格特征八个大的类别。 1.测试中的Prompt 例如对于问题"列出5种可以改善睡眠质量的方法"，如下所示： [INST] <<SYS>>You are a helpf ......

Llama2-Chinese 模型 Chinese 项目 Llama2更新时间 2023-10-05

文章《Semantic Kernel -- LangChain 的替代品？》的错误和疑问探讨

微信公众号文章 Semantic Kernel —— LangChain 的替代品?[1] ，它使用的示例代码是Python ，他却发了这么一个疑问：支持的语言对比（因为 Semantic Kernel 是用 C#开发的，所以它对 C#比较支持）如上所示。不清楚 Semantic Kernel 为什 ......

替代品 LangChain Semantic 疑问错误更新时间 2023-10-04

Llama2-Chinese项目：3.2-LoRA微调和模型量化

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式为"<s>Human: "+问题+"\n</s><s>Assistant: "+答案。本文主要介绍Llama-2-7b模型LoRA微调以及4bit量化的实践过程。 ......

Llama2-Chinese 模型 Chinese 项目 Llama2更新时间 2023-10-01

Llama2-Chinese项目：2.3-预训练使用QA还是Text数据集？

Llama2-Chinese项目给出pretrain的data为QA数据格式，可能会有疑问pretrain不应该是Text数据格式吗？而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术，给出pretrain的data为Text数据格式。所以推测应该pre ......

Llama2-Chinese Chinese 还是项目数据更新时间 2023-10-01

Llama2-Chinese项目：3.1-全量参数微调

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式如下所示： "<s>Human: "+问题+"\n</s><s>Assistant: "+答案举个例子，如下所示： <s>Human: 用一句话描述地球为什么是独 ......

Llama2-Chinese 参数 Chinese 项目 Llama2更新时间 2023-10-01

Llama2-Chinese项目：1-项目介绍和模型推理

Atom-7B与Llama2间的关系：Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢？因为原子生万物，Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型，如下所示： FlagAlpha/Atom-7B FlagAlpha/Llama ......

项目 Llama2-Chinese 模型 Chinese Llama2更新时间 2023-10-01

Llama2-Chinese项目：2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍，但是中文预训练数据的比例依然非常少，仅占0.13%，这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力，可以采用微调和预训练两种路径，其中：微调需要的算力资源少，能够快速实现一个中文Llama的雏形。但缺点也显而易见， ......

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-10-01

Llama2-Chinese项目：2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱，一个中文汉子往往被切分成多个token，因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型，然后将中文tokenizer与LLaMA原生tokenizer进行合并，最终得到一个扩展后的tokenizer模型。国内Chinese ......

词表 Llama2-Chinese 模型 Chinese 语言更新时间 2023-10-01

Llama2-Chinese项目：3.1-全量参数微调

提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式如下所示： "<s>Human: "+问题+"\n</s><s>Assistant: "+答案举个例子，如下所示： <s>Human: 用一句话描述地球为什么是独 ......

Llama2-Chinese 参数 Chinese 项目 Llama2更新时间 2023-10-01

本地部署 Langchain-Chatchat & ChatGLM

一、模型&环境介绍 1. ChatGLM github 地址：https://github.com/THUDM 模型地址：https://huggingface.co/THUDM 2. m3e 模型地址：https://huggingface.co/moka-ai/m3e-base/ 3. text ......

Langchain-Chatchat Langchain Chatchat ChatGLM amp更新时间 2023-09-26

Llama2-Chinese项目：2.3-预训练使用QA还是Text数据集？

Llama2-Chinese项目给出pretrain的data为QA数据格式，可能会有疑问pretrain不应该是Text数据格式吗？而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术，给出pretrain的data为Text数据格式。所以推测应该pre ......

Llama2-Chinese Chinese 还是项目数据更新时间 2023-09-24

LangChain使用fine-tuned GPT-3.5

LangChain使用fine-tuned GPT-3.5 参考： https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates https://platform.openai.com/docs/guides/fine-tunin ......

fine-tuned LangChain tuned fine GPT更新时间 2023-09-24

Llama2-Chinese项目：2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍，但是中文预训练数据的比例依然非常少，仅占0.13%，这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力，可以采用微调和预训练两种路径，其中：微调需要的算力资源少，能够快速实现一个中文Llama的雏形。但缺点也显而易见， ......

Llama2-Chinese Chinese 项目 Llama2 Llama更新时间 2023-09-16

Llama2-Chinese项目：2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱，一个中文汉子往往被切分成多个token，因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型，然后将中文tokenizer与LLaMA原生tokenizer进行合并，最终得到一个扩展后的tokenizer模型。国内Chinese ......

词表 Llama2-Chinese 模型 Chinese 语言更新时间 2023-09-16

GPT之路(八) LangChain - Models入门

环境：Python 3.11.4， LangChain 0.0.270, Jupyter Models模型简介官方地址：LangChian - Models Langchain所封装的模型分为两类：大语言模型 (LLM) 聊天模型 (Chat Models) Langchain的支持众多模型供应 ......

LangChain Models GPT更新时间 2023-09-16

安装langchain-chatchat

1、下载langchain-chatchat git clone https://github.com/chatchat-space/Langchain-Chatchat.git 2、下载llama2-7b-chat-hf git lfs installgit clone https://huggi ......

langchain-chatchat langchain chatchat更新时间 2023-09-14

Javascript版Langchain入门

https://baijiahao.baidu.com/s?id=1769509377621631060&wfr=spider&for=pc 介绍 LangChain是一个开源Python库，用于构建由大型语言模型（LLM）支持的应用程序。它提供了一个框架，将LLM与其他数据源（如互联网或个人文件） ......

Javascript Langchain更新时间 2023-09-11

Llama2-Chinese项目：1-项目介绍和模型推理

Atom-7B与Llama2间的关系：Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢？因为原子生万物，Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型，如下所示： FlagAlpha/Atom-7BFlagAlpha/Llama2 ......

项目 Llama2-Chinese 模型 Chinese Llama2更新时间 2023-09-11

Langchain的一些问题和替代选择

Langchain因其简化大型语言模型(llm)的交互方面的到关注。凭借其高级的API可以简化将llm集成到各种应用程序中的过程。但是Langchain乍一看似乎是一个方便的工具，但是它有时候否更像是一个语言迷宫，而不是一个直截了当的解决方案。在本文中，我们将探讨与Langchain相关的一些问题 ......

Langchain 问题更新时间 2023-09-10

GPT之路(七) LangChain AI编成框架入门的第一个demo

环境：Python 3.11.4， LangChain 0.0.270 1.Langchain 简介 1.1 Python Langchain官方文档大型语言模型（LLM）正在成为一种具有变革性的技术，使开发人员能够构建以前无法实现的应用程序。然而，仅仅依靠LLM还不足以创建一个真正强大的应用程序 ......

LangChain 框架 demo GPT更新时间 2023-09-10

bzoj #3569. DZY Loves Chinese II

https://hydro.ac/d/bzoj/p/3569 实际上，考虑类 tarjan 的过程，从这方面入手能更快地有思路。考虑先找一棵 dfs 树，那么对于未被删去的树边，我们并不需要管。若对于一条被删去的树边，那么需要底下能返祖！如果底下返不了祖，那么在这里一定就不连通了。换言之，底下的 ......

Chinese Loves bzoj 3569 DZY更新时间 2023-09-06

The 17th Chinese Northeast Collegiate Programming Contest

链接：[https://codeforces.com/gym/104366](https://codeforces.com/gym/104366) ## A. Cask Effect ```cpp #include "bits/stdc++.h" using namespace std; using ......

Programming Collegiate Northeast Chinese Contest更新时间 2023-09-05