chatglm3 chatglm fastgpt sealos

通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测

引言 “克隆 dev 环境到 test 环境，等所有服务运行正常之后，把访问地址告诉我”，“检查所有项目，告诉我有哪些服务不正常，给出异常原因和修复建议”，在过去的工程师生涯中，也曾幻想过能够通过这样的自然语言指令来完成运维任务，如今 AI 助手 Appilot 利用 LLM 蕴藏的神奇力量，将这一 ......

文心 ChatGLM 能力 DevOps Llama2更新时间 2023-11-09

ChatGLM.cpp的量化处理

chatglm.cpp的一个主要特点就是以量化的形式对大模型进行优化，使其在CPU上能够进行高效推理。本文主要查看chatglm.cpp是如何对模型进行量化的 chatglm.cpp在使用时主要分成两步：使用convert.py将模型进行量化，得到ggml格式使用./build/bin/mai ......

ChatGLM cpp更新时间 2023-11-09

ChatGLM2 源码解析：`ChatGLMTokenizer`

import os import torch from typing import List, Optional, Union, Dict from sentencepiece import SentencePieceProcessor from transformers import PreTra ......

ChatGLMTokenizer 源码 ChatGLM2 ChatGLM更新时间 2023-11-09

Sealos 私有云正式发布，三倍性能 1/5 成本

马斯克将推特下云后可以节省 60% 成本，不代表你可以。但是有了 Sealos 之后，你真的可以！ Sealos 私有云正式发布，详情地址：https://sealos.run/zh-Hans/self-hosting 原文链接：https://forum.laf.run/d/1091 成本分析 ......

性能成本 Sealos更新时间 2023-11-07

Langchain-Chatchat项目：5.1-ChatGLM3-6B工具调用

在语义、数学、推理、代码、知识等不同角度的数据集上测评显示，ChatGLM3-6B-Base 具有在10B以下的基础模型中最强的性能。ChatGLM3-6B采用了全新设计的Prompt格式，除正常的多轮对话外。同时原生支持工具调用（Function Call）、代码执行（Code Interpret ......

Langchain-Chatchat Langchain Chatchat ChatGLM3 ChatGLM更新时间 2023-11-06

使用 OKhttp3 实现 ChatGLM HTTP 调用(SSE、异步、同步)

目录1. 准备工作2. SSE 调用3. 异步调用4. 同步调用5. 附录5.1 组装鉴权 token5.2 接口请求参数为了熟悉下 OKhttp 和 ChatGLM 接口，写几个 demo 试试 1. 准备工作从 ChatGLM 的接口文档可知，每次 HTTP 调用都需要带上一个鉴权 toke ......

OKhttp3 ChatGLM OKhttp HTTP SSE更新时间 2023-11-06

ChatGLM3本地部署

如何用免费GPU线上跑AI项目实践 - 飞书云文档 (feishu.cn) 准备步骤： 1.配置好环境pytorch2.0.1 python3.9 2.进入JupyterLab进入开发环境 3.将glm3从开源项目中git下来，这里在terminal输入指令后，输入github的账号密码进行git。 ......

ChatGLM3 ChatGLM更新时间 2023-11-04

使用 Sealos 将 ChatGLM3 接入 FastGPT，打造完全私有化 AI 客服

FastGPT 是一款专为客服问答场景而定制的开箱即用的 AI 知识库问答系统。该系统具备可视化工作流功能，允许用户灵活地设计复杂的问答流程，几乎能满足各种客服需求。在国内市场环境下，离线部署对于企业客户尤为重要。由于数据安全和隐私保护的考虑，企业通常不愿意将敏感数据上传到线上大型 AI 模型 ( ......

ChatGLM3 ChatGLM FastGPT Sealos AI更新时间 2023-11-02

使用单卡v100 32g或更低显存的卡，使用peft工具qlora或lora混合精度训练大模型chatGLM2-6b，torch混合精度加速稳定训练,解决qlora loss变成nan的问题！

最近新换了工作，以后的工作内容会和大模型相关，所以先抽空跑了一下chatGLM2-6b的demo，使用Qlora或lora微调模型今天简单写个文档记录一下，顺便也是一个简单的教程，并且踩了qlora loss变成nan训练不稳定的问题本教程并没有写lora的原理，需要的话自行查阅 1.chatG ......

精度 qlora 显存的卡 chatGLM2更新时间 2023-11-02

转：ChatGLM3-6B测评

全新ChatGLM3-6B针对七项RAG能力的评测，谁最适合RAG？原创这个男人来自千祥土猛的员外 2023-10-30 17:32 发表于浙江 https://mp.weixin.qq.com/s/6fnZt2sBTakfXZMcS-scPA 1.实体提取实体和关系提取当然也可以使用NER ......

ChatGLM3 ChatGLM 6B更新时间 2023-10-31

使用 Sealos 一键部署 Kubernetes 集群

Sealos 是一款以 Kubernetes 为内核的云操作系统发行版，使用户能够像使用个人电脑一样简单地使用云。与此同时，Sealos 还提供一套强大的工具，可以便利地管理整个 Kubernetes 集群的生命周期。 Sealos 不仅可以一键安装一个单节点的 Kubernetes 开发环境，还 ......

集群 Kubernetes Sealos更新时间 2023-10-30

python 部署chatglm2b

下载模型实现然后手动下载模型 GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/THUDM/chatglm2-6b cd ChatGLM2-6B mkdir modelsglm && cd modelsglm vim downs.py # ......

chatglm2b chatglm2 chatglm python 2b更新时间 2023-10-24

LLM探索：为ChatGLM2的gRPC后端增加连续对话功能

前言之前我做 AIHub 的时候通过 gRPC 的方式接入了 ChatGLM 等开源大模型，对于大模型这块我搞了个 StarAI 框架，相当于简化版的 langchain ，可以比较方便的把各种大模型和相关配套组合在一起使用。主要思路还是用的 OpenAI 接口的那套，降低学习成本，但之前为了快 ......

ChatGLM2 ChatGLM 功能 gRPC LLM更新时间 2023-10-19

教你如何基于MindSpore进行ChatGLM微调

本文分享自华为云社区《基于MindSpore的ChatGLM微调》，作者： JeffDing 。基于MindSpore的ChatGLM微调克隆Hugging Face模型克隆chatglm-6b代码仓，下载分布式的模型文件 git lfs install git clone https://h ......

MindSpore ChatGLM更新时间 2023-10-16

基于 P-Tuning v2 进行 ChatGLM2-6B 微调实践

微调类型简介 1. SFT监督微调：适用于在源任务中具有较高性能的模型进行微调，学习率较小。常见任务包括中文实体识别、语言模型训练、UIE模型微调。优点是可以快速适应目标任务，但缺点是可能需要较长的训练时间和大量数据。 2. LoRA微调：通过高阶矩阵秩的分解减少微调参数量，不改变预训练模型参数，新 ......

P-Tuning ChatGLM2 ChatGLM Tuning 6B更新时间 2023-10-13

【开源】给ChatGLM写个，Java对接的SDK

作者：小傅哥 - 百度搜小傅哥bugstack 博客：bugstack.cn 沉淀、分享、成长，让自己和他人都能有所收获！😄 大家好，我是技术UP主小傅哥。清华大学计算机系的超大规模训练模型 ChatGLM-130B 使用效果非常牛，所以我也想把这样的Ai能力接入到自己的应用中或者做一些 In ......

ChatGLM Java SDK更新时间 2023-10-13

centos7 本地私有化部署sealos 桌面

sealos 是什么？我想引用它官方的一句话改造下，sealos 让云像个人电脑一样简单官方文档地址：https://docs.sealos.io/zh-Hans/docs/Intro 今年6月份，sealos 正式发布了公有云托管版本，网上私有化教程不多，自己一点小坑现记录如下主要参考 htt ......

桌面 centos7 centos sealos更新时间 2023-10-10

Langchain-Chatchat项目：1.1-ChatGLM2项目整体介绍

ChatGLM2-6B是开源中英双语对话模型ChatGLM-6B的第2代版本，引入新的特性包括更长的上下文(基于FlashAttention技术，将基座模型的上下文长度由ChatGLM-6B的2K扩展到了32K，并在对话阶段使用8K的上下文长度训练)；更高效的推理(基于Multi-QueryAtte ......

项目 Langchain-Chatchat Langchain Chatchat ChatGLM2更新时间 2023-10-07

ChatGLM2

下载chatglm2-6b print('开始加载分词器tokenizer...') tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True) print('开始加载语言模型model ......

ChatGLM2 ChatGLM更新时间 2023-09-28

Fireboom on Sealos：半小时搞定一个月的接口工作

后端日常开发工作中有 88% 的接口都是 CURD，占用了超过 6 成开发时间。这些工作枯燥乏味，且价值低下，不仅荒废了时间，还无法获得任何成就感。而 Fireboom 可在 2 分钟内，完成传统模式下 2 天才能完成的接口，让后端开发者不再搬砖。 👀 Fireboom 是什么 Fb 是可视化 A ......

Fireboom 接口小时 Sealos on更新时间 2023-09-28

ChatGLM-6B-PT微调

目录开发环境ChatGLM2-6B源码下载模型安装依赖下载ADGEN数据集微调前修改训练步数微调后开发环境矩池云 https://www.matpool.com/host-market/gpu ChatGLM2-6B源码 https://github.com/THUDM/ChatGLM2-6B ......

ChatGLM 6B-PT 6B PT更新时间 2023-09-28

使用Triton部署chatglm2-6b模型

一、技术介绍 NVIDIA Triton Inference Server是一个针对CPU和GPU进行优化的云端和推理的解决方案。支持的模型类型包括TensorRT、TensorFlow、PyTorch(meta-llama/Llama-2-7b)、Python(chatglm)、ONNX Run ......

chatglm2 模型 chatglm Triton 6b更新时间 2023-09-27

使用 Sealos 构建低成本、高效能的私有云

这个时候谈论私有云似乎有点反直觉？大部分人认知不是上云是大趋势嘛？我也比较认可上云，不过私有云也是云，今天给大家带来一个新的选择 —— 用云，只需一个 Sealos 就够了。看看我们怎么做到更低的成本，更高的稳定性和性能的。 PS：我们从不脱离场景谈优势，不同场景选不同的云肯定是硬道理。 🏗️ ......

成本 Sealos更新时间 2023-09-27

使用sealos按照k8s

# 获取sealos命令行工具wget https://github.com/labring/sealos/releases/download/v4.3.3/sealos_4.3.3_linux_amd64.tar.gz \ && tar zxvf sealos_4.3.3_linux_amd64. ......

sealos k8s k8 8s更新时间 2023-09-27

本地部署 Langchain-Chatchat & ChatGLM

一、模型&环境介绍 1. ChatGLM github 地址：https://github.com/THUDM 模型地址：https://huggingface.co/THUDM 2. m3e 模型地址：https://huggingface.co/moka-ai/m3e-base/ 3. text ......

Langchain-Chatchat Langchain Chatchat ChatGLM amp更新时间 2023-09-26

FastGPT 接入飞书（不用写一行代码）

FastGPT V4 版本已经发布，可以通过 Flow 可视化进行工作流编排，从而实现复杂的问答场景，例如联网谷歌搜索，操作数据库等等，功能非常强大，还没用过的同学赶紧去试试吧。飞书相比同类产品算是体验非常好的办公工具了，我司也是废了很大的劲才迁到飞书，所以我们先来接入飞书的教程。原文链接：ht ......

一行不用 FastGPT 代码更新时间 2023-09-20

16G内存+CPU本地部署ChatGLM2/Baichuan2推理（Windows/Mac/Linux）

概述本文使用chatglm.cpp对中文大语言模型（LLM）进行量化与推理，支持ChatGLM2-6B、Baichuan2-13B-Chat等模型在CPU环境16G内存的个人电脑上部署，实现类似ChatGPT的聊天功能。支持的操作系统包括Windows、Mac OS、Linux等。其中，量化过程 ......

Baichuan2 Baichuan ChatGLM2 内存 ChatGLM更新时间 2023-09-19

3 分钟把高质量 AI 知识库 FastGPT 装进企业微信

FastGPT V4 已经上线，直接冲上 GitHub Trending。如果你还不知道 FastGPT 是什么，可以先去看看作者的介绍👇 👉使用 FastGPT 构建高质量 AI 知识库非常多的企业都有把 AI 知识库装进企业微信的需求，奈何企业微信限制太多，不是 IP 地址不可信就是需要 ......

知识库高质量 FastGPT 知识企业更新时间 2023-09-19

Sealos 新功能“定时任务”上线(省钱大杀器)

流量高峰时段资源不足？低流量时段服务器成本过高？本着好用又省钱的目标，sealos 推出定时任务功能，保证稳定的同时降低成本。 Sealos 国内集群：https://cloud.sealos.top Sealos 海外集群：https://cloud.sealos.io 原文链接：https ......

新功能任务 Sealos更新时间 2023-09-18

解决 ChatGLM.CPP+clBlast 编译错误（也适用于SD.CPP）

首先安装 OpenCL 和 clblast： vcpkg install opencl clblast 下载GitHub 上的源码： git clone --recurse-submodules https://github.com/li-plus/chatglm.cpp cd chatglm.cp ......

CPP 错误 ChatGLM clBlast SD更新时间 2023-09-18

共140篇 :2/5页 首页上一页12345下一页尾页