pre-trained transformer generative模型

模型类序列化器

1 原来用的Serilizer跟表模型没有直接联系, 模型类序列化器ModelSerilizer,跟表模型有对应关系 2 使用 class BookModelSerializer(serializers.ModelSerializer): class Meta: model=表模型 # 跟哪个表模型 ......
序列 模型

挑战Transformer的新架构Mamba解析以及Pytorch复现

今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模” Mamba一直在人工智能界掀起波澜,被吹捧为Transformer的潜在竞争对手。到底是什么让Mamba在拥挤的序列建中脱颖而出? 在介绍之前先简要回顾一下现有的模型 Transformer:以其注意力机制而闻名,其中序 ......
Transformer 架构 Pytorch Mamba

【略读论文|大模型相关】Zero-Shot Relational Learning on Temporal Knowledge Graphs with Large Language Models

时间:2023 学校:慕尼黑大学 创新点: 1.据我们所知,这是第一个试图在TKGF背景下研究零射击关系学习的工作。 2.我们设计了一种基于llm的方法zrLLM,并设法在零射击关系推理中增强各种基于嵌入的TKGF模型。 3.实验结果表明,zrLLM有助于大大提高所有考虑的TKGF模型对包含未见零射 ......

星型模型&雪花模型

数据集市(Data Mart)也有称ADS(Application Data Store),数据集市将主题层和基础层的数据按照各业务的实际需求进行聚合,形成宽表或数据立方体(Cube),可直接供业务部门和数据分析团队使用。 数据集市中主要存在的是事实表(fact)和维度表(dimension)。 事 ......
模型 雪花 amp

《Span-Based Joint Entity and Relation Extraction with Transformer Pre-Training》阅读笔记

代码 原文地址 预备知识: 1.什么是束搜索算法(beam search)? beam search是一种用于许多自然语言处理和语音识别模型的算法,作为最终决策层,用于在给定目标变量(如最大概率或下一个输出字符)的情况下选择最佳输出。 2.什么是条件随机场(Conditional Random Fi ......

R语言GARCH族模型:正态分布、t、GED分布EGARCH、TGARCH的VaR分析股票指数|附代码数据

全文链接:http://tecdat.cn/?p=31023 最近我们被客户要求撰写关于GARCH族模型的研究报告,包括一些图形和统计输出。 如何构建合适的模型以恰当的方法对风险进行测量是当前金融研究领域的一个热门话题 ( 点击文末“阅读原文”获取完整代码数据******** )。 VaR方法作为当 ......
正态分布 模型 指数 语言 代码

AI_NLP以及SAM的理解-分割模型

机器学习 一般机器学习分为有监督学习,无监督学习和强化学习 无监督学习 Unsupervised Learning Self-Supervised Learning,又称为自监督学习 -Self-Supervised Learning 的核心思想 Masked Autoencoders Are Sc ......
模型 AI_NLP NLP SAM AI

用一张图片测试几个大模型的看图理解,文心一言表现不佳,通义千问了解最到位!

样图如下: 用上面的图片,在几个主流的AI大模型中进行识别理解,最终的理解各有不同。 不过最让我意外的是 文心一言 居然理解的最不到位! 下图是文心一言的看图理解: 下图是通义千问的看图理解: 下图是讯飞星火的看图理解: 大家觉得哪一个理解的最到位????? ......
文心 模型 图片

使用docker搭建deepspeed多机多卡分布式微调大模型环境

前置环境:两台可以互通的centos服务器(服务器1、服务器2),docker,NVIDIA驱动 docker创建overlay共享网络 1)选用服务器1作为manage节点进行初始化,执行docker swarm init Swarm initialized: current node (ly4d ......
分布式 deepspeed 模型 环境 docker

公共仓库元模型(CWM)(转)

转自:https://www.jianshu.com/p/21207b50084a 一、什么是CWM? 在我们学习一个新东西时,首先得弄懂明白它是用来干什么的?然后通过实例与理论交错学习,CWM——Common Warehouse Metamodel, 很明显翻译过来时公共仓库元模型,CWM的提出主 ......
仓库 模型 CWM

Atlas关系型数据库元数据模型

[ { "category": "ENTITY", "guid": "00b4a314-1185-4cd4-84e9-20275990d58d", "createdBy": "hadoop", "updatedBy": "hadoop", "createTime": 1615973091411, " ......
数据 模型 数据库 Atlas

使用知识图谱提高RAG的能力,减少大模型幻觉

在使用大型语言模型(llm)时,幻觉是一个常见的问题。LLM生成流畅连贯的文本,但往往生成不准确或不一致的信息。防止LLM产生幻觉的方法之一是使用提供事实信息的外部知识来源,如数据库或知识图谱。 向量数据库和知识图谱 向量数据库 向量数据库是表示实体或概念(如单词、短语或文档)的高维向量的集合。数据 ......
图谱 幻觉 模型 能力 知识

三维模型的几何坐标纠正应用探讨

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作,从而实现三维模型轻量化。轻量化压缩比大,模型轻量化效率高,自动化处理能力高;采用多种算法对三维模型进行几何精纠正处理,精度高,... ......
坐标 几何 模型

鱼类识别系统Python+TensorFlow卷积神经网络算法模型+深度学习人工智能【计算机课设项目】

一、介绍 鱼类识别系统。使用Python作为主要编程语言开发,通过收集常见的30种鱼类('墨鱼', '多宝鱼', '带鱼', '石斑鱼', '秋刀鱼', '章鱼', '红鱼', '罗非鱼', '胖头鱼', '草鱼', '银鱼', '青鱼', '马头鱼', '鱿鱼', '鲇鱼', '鲈鱼', '鲍鱼' ......

开课吧前端1期.阶段5:generator,模块化与babel

复习:ES6 变量let、箭头function、参数等、map、reduce、filter、forEach Promise消除回调,Promise.all([p1,p2,p3]).then() 单独Promise并不能帮我们解决所有问题,还有2个兄弟是从Promise过度出来的,generator ......
前端 generator 模块 阶段 babel

Windows11下私有化部署大语言模型实战 langchain+llama2

一、本机环境 1.硬件环境: CPU:锐龙5600X 显卡:GTX3070 内存:32G 注:硬件配置仅为博主的配置,不是最低要求配置,也不是推荐配置。 2.软件环境: Windows系统版本:Win11专业版23H2 Python版本:3.11 Cuda版本:12.3.2 VS版本:VS2022 ......
实战 langchain 模型 Windows 语言

使用PyTorch实现去噪扩散模型

在深入研究去噪扩散概率模型(DDPM)如何工作的细节之前,让我们先看看生成式人工智能的一些发展,也就是DDPM的一些基础研究。 VAE VAE 采用了编码器、概率潜在空间和解码器。在训练过程中,编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进行采样,并将其传递到解码器中,其中输入的图像预计 ......
模型 PyTorch

根据语音生成全身姿态;基于变分贝叶斯框架的VAE模型;CFG是一种隐式的Perceptual Loss!

本文首发于公众号:机器感知 根据语音全身姿态;基于变分贝叶斯框架的VAE模型;CFG是一种隐式的Perceptual Loss! Diffusion Model with Perceptual Loss 本文研究了扩散模型在生成样本时的质量问题,作者发现使用均方误差损失训练的模型生成的样本往往不真实 ......
Perceptual 姿态 框架 语音 模型

首次引入大模型!Bert-vits2-Extra中文特化版40秒素材复刻巫师3叶奈法

Bert-vits2项目又更新了,更新了一个新的分支:中文特化,所谓中文特化,即针对中文音色的特殊优化版本,纯中文底模效果百尺竿头更进一步,同时首次引入了大模型,使用国产IDEA-CCNL/Erlangshen-MegatronBert-1.3B大模型作为Bert特征提取,基本上完全解决了发音的ba ......
巫师 Bert-vits 素材 模型 Extra

一文搞懂什么是阻塞IO、信号驱动IO、Reactor模型、零拷贝

公众号《鲁大猿》,寻精品资料,帮你构建Java全栈知识体系 www.jiagoujishu.cn 基础IO 如何从数据传输方式理解IO流? 从数据传输方式或者说是运输方式角度看,可以将 IO 类分为: 字节流, 字节流读取单个字节,字符流读取单个字符(一个字符根据编码的不同,对应的字节也不同,如 U ......
拷贝 模型 信号 Reactor

大模型安全|绿盟

转载:大模型正在“记住”与“说出” 引言 「大模型」引领的创新变革正在发生身处技术爆炸时代,高光与隐忧共存。安全风险已成为发展中无法忽视的话题。 LLM在使用过程中包含敏感机密的数据或信息,可能会导致未授权的数据访问、隐私侵犯、安全漏洞等风险,随之造成敏感信息泄露。 2023年8月,全球开放应用软件 ......
模型

书生浦语大模型全链开源体系介绍

Smiling & Weeping 以后隔着三千梨花树,六百湘水,你不必哽咽,我始终记得见你的第一面 2023大模型成为热门关键词 而通用大模型在大模型中适用范围和效率无疑会更高 那么书生·浦语20B开源大模型性能介绍 那么从模型到应用的主要流程大概 书生·浦语全链条开源开放体系 全链条开源开放体系 ......
书生 模型 体系

聊聊 从源码来看ChatGLM-6B的模型结构

基于ChatGLM-6B第一版,要注意还有ChatGLM2-6B以及ChatGLM3-6B 概述 ChatGLM是transformer架构的神经网络模型,因此从transformer结构入手,分析其源码结构。 transformer结构: 转载请备注出处:https://www.cnblogs.c ......
源码 模型 ChatGLM 结构 6B

ICLR 2022: Anomaly Transformer论文阅读笔记+代码复现

本论文全名为Anomaly Transformer: Time Series Anomaly Detection with Association Descrepancy(通过关联差异进行时序异常检测),主要提出了一种无监督的异常点检测算法,并在6个benchmarks上测试,获取良好结果。 论文链 ......
Transformer Anomaly 代码 笔记 论文

R语言中的马尔可夫区制转移(Markov regime switching)模型|附代码数据

原文链接:http://tecdat.cn/?p=12187 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于马尔可夫区制转移模型的研究报告,包括一些图形和统计输出。 金融分析师通常关心检测市场何时“发生变化”:几个月或至几年内市场的典型行为可以立即转变为非常不同的行为。投资者希望及时发现这 ......
switching 模型 语言 代码 数据

​Github揽获3k+星!清华开源CogAgent:基于多模态大模型的GUI Agent

前言 本文提出了视觉 GUI Agent,使用视觉模态(而非文本)对 GUI 界面进行更全面直接的感知,从而做出规划和决策。对此,我们研发了多模态大模型 CogAgent,可接受 1120×1120 的高分辨率图像输入,不仅提升了通用视觉理解能力,还具备强大的 GUI Agent 能力。 本文转载自 ......
模态 CogAgent 模型 Github Agent

大语言模型优化方法简介:Prompt、RAG、Fine-tuning

GPT、LLama、Gemini等大语言模型虽展现出强大能力,但在实际应用中仍有问题,例如在准确性、知识更新速度和答案透明度方面,仍存在挑战。 论文“Retrieval-Augmented Generation for Large Language Models: A Survey(面向大语言模型的 ......
Fine-tuning 模型 语言 简介 方法

对盒模型的理解

CSS中的盒模型有两种:标准盒子模型、IE盒子模型。 盒模型都是由4个部分组成的:content、padding、border和margin。 标准盒模型和IE盒模型的区别在于设置width和height时,对应的范围不同: 标准盒模型的width和height属性的范围只包含了content; I ......
模型

书生·浦语大模型全链路开源体系——学习笔记

学习来源:https://www.bilibili.com/video/BV1Rc411b7ns/ 资料来源:https://github.com/InternLM/tutorial/discussions/36 (有同学发pdf,还有其他同学的笔记) 俺没啥知识积累,很多信息不太会折叠。姑且做个笔 ......
链路 书生 模型 体系 笔记

基于Matlab实现电力电子仿真模型

1. 引言电力电子是电力系统中的重要组成部分,它涉及到能量转换和功率控制等关键技术。为了研究和优化电力电子设备的性能,建立仿真模型是一种重要的手段。Matlab作为一种强大的数学软件,提供了丰富的工具和功能,可以帮助我们实现电力电子仿真模型。 2. Matlab实现电力电子仿真模型的基本步骤2.1 ......
模型 电力 Matlab 电子
共3980篇  :3/133页 首页上一页3下一页尾页