6B

聊聊ChatGLM-6B源码分析(二)

基于ChatGLM-6B第一版，要注意还有ChatGLM2-6B以及ChatGLM3-6B 转载请备注出处：https://www.cnblogs.com/zhiyong-ITNote/ ChatGLMPreTrainedModel 官方的描述是处理权重初始化的抽象类，以及下载和加载预训练模型的接 ......

源码 ChatGLM 6B更新时间 2024-01-12

聊聊ChatGLM-6B的源码分析

基于ChatGLM-6B第一版，要注意还有ChatGLM2-6B以及ChatGLM3-6B 转载请备注出处：https://www.cnblogs.com/zhiyong-ITNote/ PrefixEncoder 作用：在微调时（以P-Tuning V2为例），方法训练时冻结模型的全部参数，只激活 ......

源码 ChatGLM 6B更新时间 2024-01-08

聊聊从源码来看ChatGLM-6B的模型结构

基于ChatGLM-6B第一版，要注意还有ChatGLM2-6B以及ChatGLM3-6B 概述 ChatGLM是transformer架构的神经网络模型，因此从transformer结构入手，分析其源码结构。 transformer结构：转载请备注出处：https://www.cnblogs.c ......

源码模型 ChatGLM 结构 6B更新时间 2024-01-06

聊聊ChatGLM6B的微调脚本及与Huggingface的关联

本文首先分析微调脚本trainer.sh的内容，再剖析ChatGLM是如何与Huggingface平台对接，实现transformers库的API直接调用ChatGLM模型，最后定位到了ChatGLM模型的源码文件。脚本分析微调脚本： PRE_SEQ_LEN=128 LR=2e-2 CUDA_V ......

Huggingface 脚本 ChatGLM6B ChatGLM6 ChatGLM更新时间 2024-01-03

聊聊ChatGLM-6B部署与微调的深入理解

ChatGLM的部署，主要是两个步骤：在Github上下载chatglm的库文件在Hugging Face上下载模型参数与配置文件 ChatGLM包从Github上看ChatGLM项目文件的结构来看，仅仅是包含三种部署方式的py代码与微调的py代码而相关的实现细节，比如神经网络、激活函数、损 ......

ChatGLM 6B更新时间 2024-01-02

使用vLLM和ChatGLM3-6b批量推理

当数据量大的时候，比如百万级别，使用 ChatGLM3-6b 推理的速度是很慢的。发现使用 vLLM 和 ChatGLM3-6b 批量推理极大的提高了推理效率。本文主要通过一个简单的例子进行实践。 1.安装 vLLM 和PyTorch [2] 除了 Python（本文使用 3.11）、CUDA（本文 ......

ChatGLM3 ChatGLM vLLM 6b更新时间 2023-12-23

1-1 本章概述 286b6b87393147adb7126f9f63e1490a

1-1 本章概述 hello，幕后网的各位未来的架构师们，你们好，我是姚半仙。那这一章开始了，我们就拉开了一个非常宏大的培训计划。叫什么呀？架构式养成计划。那首先我们在这个养成计划的第一季里跟同学们聊这样的一个话题，对架构师的种种误解。那我们为什么把这个话题把放在架构师养成计划的第一季最开始？英文 ......

b87393147 87393147 1490a 7126f e1490更新时间 2023-12-17

ChatGLM2-6B模型的微调

概述 GLM模型底层还是基于Transformer，因此其设计、优化都是围绕Transformer的各个组件的。从注意力层的掩码、位置编码等方面优化与设计。 ChatGLM3/ChatGLM2的源码中，比如finetune、trainer等代码，其实是copy自HuggingFace，而且其使用流程 ......

ChatGLM2 模型 ChatGLM 6B更新时间 2023-12-14

未能加载文件或程序集“Newtonsoft.Json, Version=4.5.0.0, Culture=neutral, PublicKeyToken=30ad4fe6b2a6aeed”或它的某一个依赖项。系统找不到指定的文件。

报错内容解决办法：在Web.config的 <configuration></configuration>中添加如下代码即可。 <configuration> <runtime> <assemblyBinding xmlns="urn:schemas-microsoft-com:asm.v1"> ......

文件 PublicKeyToken Newtonsoft Culture Version更新时间 2023-11-24

chatglm3-6b尝试

十月底智谱开元路chatglm3，果断来尝试一下。 1.ChatGLM3 亮点 ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，Chat ......

chatglm3 chatglm 6b更新时间 2023-11-15

ChatGLM3-6B：新一代开源双语对话语言模型，流畅对话与低部署门槛再升级

ChatGLM3-6B：新一代开源双语对话语言模型，流畅对话与低部署门槛再升级 1.ChatGLM3简介 ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多 ......

双语门槛新一代 ChatGLM3 模型更新时间 2023-11-15

Langchain-Chatchat项目：5.1-ChatGLM3-6B工具调用

在语义、数学、推理、代码、知识等不同角度的数据集上测评显示，ChatGLM3-6B-Base 具有在10B以下的基础模型中最强的性能。ChatGLM3-6B采用了全新设计的Prompt格式，除正常的多轮对话外。同时原生支持工具调用（Function Call）、代码执行（Code Interpret ......

Langchain-Chatchat Langchain Chatchat ChatGLM3 ChatGLM更新时间 2023-11-06

使用单卡v100 32g或更低显存的卡，使用peft工具qlora或lora混合精度训练大模型chatGLM2-6b，torch混合精度加速稳定训练,解决qlora loss变成nan的问题！

最近新换了工作，以后的工作内容会和大模型相关，所以先抽空跑了一下chatGLM2-6b的demo，使用Qlora或lora微调模型今天简单写个文档记录一下，顺便也是一个简单的教程，并且踩了qlora loss变成nan训练不稳定的问题本教程并没有写lora的原理，需要的话自行查阅 1.chatG ......

精度 qlora 显存的卡 chatGLM2更新时间 2023-11-02

转：ChatGLM3-6B测评

全新ChatGLM3-6B针对七项RAG能力的评测，谁最适合RAG？原创这个男人来自千祥土猛的员外 2023-10-30 17:32 发表于浙江 https://mp.weixin.qq.com/s/6fnZt2sBTakfXZMcS-scPA 1.实体提取实体和关系提取当然也可以使用NER ......

ChatGLM3 ChatGLM 6B更新时间 2023-10-31

基于 P-Tuning v2 进行 ChatGLM2-6B 微调实践

微调类型简介 1. SFT监督微调：适用于在源任务中具有较高性能的模型进行微调，学习率较小。常见任务包括中文实体识别、语言模型训练、UIE模型微调。优点是可以快速适应目标任务，但缺点是可能需要较长的训练时间和大量数据。 2. LoRA微调：通过高阶矩阵秩的分解减少微调参数量，不改变预训练模型参数，新 ......

P-Tuning ChatGLM2 ChatGLM Tuning 6B更新时间 2023-10-13

ChatGLM-6B-PT微调

目录开发环境ChatGLM2-6B源码下载模型安装依赖下载ADGEN数据集微调前修改训练步数微调后开发环境矩池云 https://www.matpool.com/host-market/gpu ChatGLM2-6B源码 https://github.com/THUDM/ChatGLM2-6B ......

ChatGLM 6B-PT 6B PT更新时间 2023-09-28

使用Triton部署chatglm2-6b模型

一、技术介绍 NVIDIA Triton Inference Server是一个针对CPU和GPU进行优化的云端和推理的解决方案。支持的模型类型包括TensorRT、TensorFlow、PyTorch(meta-llama/Llama-2-7b)、Python(chatglm)、ONNX Run ......

chatglm2 模型 chatglm Triton 6b更新时间 2023-09-27

chatglm2-6b在P40上做LORA微调

目前，大模型的技术应用已经遍地开花。最快的应用方式无非是利用自有垂直领域的数据进行模型微调。chatglm2-6b在国内开源的大模型上，效果比较突出。本文章分享的内容是用chatglm2-6b模型在集团EA的P40机器上进行垂直领域的LORA微调。 ......

chatglm2 chatglm LORA P40 6b更新时间 2023-09-06

一、【ChatGLM-6B学习】-搭建一个简单的大模型

最近业务上需要用到大模型相关的知识，所以准备简单的搭建一个环境，详细的细节后面慢慢研究，现记录下搭建过程。至于为什么选择ChatGLM-6B,主要原因是它支持中英双语，同时支持离线部署，可以方便的构建本地化的问答知识库。由于ChatGLM-6B对python版本有一定要求，目前要求3.7+版本，为 ......

模型 ChatGLM 6B更新时间 2023-08-25

解锁ChatGLM-6B的潜力：优化大语言模型训练，突破任务困难与答案解析难题

# 解锁ChatGLM-6B的潜力：优化大语言模型训练，突破任务困难与答案解析难题 LLM（Large Language Model）通常拥有大量的先验知识，使得其在许多自然语言处理任务上都有着不错的性能。但，想要直接利用 LLM 完成一些任务会存在一些答案解析上的困难，如规范化输出格式，严格服从 ......

难题潜力模型答案任务更新时间 2023-08-23

利用text-generation-webui快速搭建chatGLM2-6b/LLAMA2-7B-chat大模型运行环境

text-generation-webui 是一个基于Gradio的LLM Web UI开源项目，可以利用其快速搭建各种文本生成的大模型环境。一、安装 text-generation-webui的readme其实已写得相当详细了，这里就不再重复，只说1个可能存在的坑：安装 peft 安装卡住 r ......

text-generation-webui generation chatGLM2 模型 chatGLM更新时间 2023-08-19

chatglm2-6b模型在9n-triton中部署并集成至langchain实践

本文将介绍我利用集团9n-triton工具部署ChatGLM2-6B过程中踩过的一些坑，希望可以为有部署需求的同学提供一些帮助。 ......

9n-triton langchain chatglm2 模型 chatglm更新时间 2023-08-16

CentOS7 上安装部署chatglm2-6b

按照说明文档，先按照了最新版本的Python，官网下载了最新的版本3.11后，一顿操作感觉分分钟就安装完了。但是继续安装chatglm2-6b 所需的依赖包时，就遇到了N多坑点，为了解决这些坑点，耗时真的很长（按周计算的那种）。第一个坑点：安装Python时，没有带SSL：解决办法：详细可以参 ......

chatglm2 CentOS7 chatglm CentOS 6b更新时间 2023-08-14

ChatGLM2-6B 微调改变AI自我认知

一、前言上篇说到ChatGLM2-6B及百川大模型的本地部署实战，实际商业项目中可能还需要在此基础上对模型进行相关微调再进行应用。本篇文章带大家微调入门教学。注意：当前为AI技术高速发展期，技术更新迭代快，本文章仅代表作者2023年8月的观点。上篇文章：ChatGLM2-6B清华开源本地部署 ......

ChatGLM2 ChatGLM 6B更新时间 2023-08-14

ChatGLM2-6B清华开源本地部署

一、前言随着科技的不断发展，人工智能作为一项新兴技术，已逐渐渗透到各行各业。 AI 技术发展迅速、竞争激烈，需要保持对新技术的关注和学习。 ChatGPT的强大无需多说，各种因素国内无法商用，本文仅探讨：ChatGLM2 、百川13B大模型。两者都可以免费本地部署和商用。 ChatGLM官网体验地 ......

ChatGLM2 ChatGLM 6B更新时间 2023-08-14

在矩池云使用ChatGLM-6B & ChatGLM2-6B

ChatGLM-6B 和 ChatGLM2-6B都是基于 General Language Model (GLM) 架构的对话语言模型，是清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同发布的语言模型。模型有 62 亿参数，一经发布便受到了开源社区的欢迎，在中文语义理解和对话生成上有着 ......

ChatGLM ChatGLM2 6B amp更新时间 2023-08-09

阿里云部署 ChatGLM2-6B 与 langchain+chatGLM

# 1.ChatGLM2-6B 部署 - 更新系统 ``` apt-get update ``` - 安装git ``` apt-get install git-lfs git init git lfs install ``` - 克隆 ChatGLM2-6B 源码 ``` git clone ht ......

langchain ChatGLM2 ChatGLM chatGLM 6B更新时间 2023-08-05

ubuntu上搭建ChatGLM2-6b环境及ptuing微调训练的坑

清华大学的chatGLM2-6B可以说是目前亚洲唯一能打的对中文支持不错的LLM大模型，网上已经有很多介绍如何在本机搭建环境的文章，就不再重复了，这里记录下最近踩的一些坑： 1、为啥要使用ubuntu? chatGLM2-6b项目里有很多.sh文件，在windows下要正常运行通常要折腾一番，最后能 ......

ChatGLM2 ChatGLM 环境 ubuntu ptuing更新时间 2023-07-30

阿里云部署langchain+chatglm2-6b大模型

[https://mp.weixin.qq.com/s/uvKQUeL6bf2eNwKOLk7c0w](https://mp.weixin.qq.com/s/uvKQUeL6bf2eNwKOLk7c0w) * 基本上参考这篇文章就ok * 需要注意的点 1. git-lfs的安装 https://g ......

langchain chatglm2 模型 chatglm 6b更新时间 2023-07-25

LangChain+ChatGLM2-6B搭建知识库

ChatGLM2-6B 介绍 ChatGLM2-6B 在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，引入了如下新特性： • 更强大的性能：基于 ChatGLM 初代模型的开发经验，全面升级了基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数，经过了 1.4T 中英标识 ......

知识库 LangChain ChatGLM2 ChatGLM 知识更新时间 2023-07-15

共55篇 :1/2页 首页上一页12下一页尾页