transformer模型gpt

[pytorch] 训练时冻结一部分模型的参数 —— module.requires_grad_(False)

prologue title: [pytorch] 训练时冻结一部分模型的参数 —— module.requires_grad_(False) 代码用到一个解码器\(dec\),希望用它预测生成结果\(g\)的counting encode并用以计算损失,以此约束生成器生成合理的结果(能解码出正确的 ......
requires_grad requires 模型 参数 pytorch

统一过程(UP)模型

......
模型 过程

喷泉模型

......
喷泉 模型

大模型与KG(三)——时序知识图谱调研

因为后面还是打算继续做时序知识图谱的方向,所以借着这次看论文的机会,把时序KG的论文也都看一下,以对这块有个了解。中间过了个国庆,又夹杂上别的乱七八糟的事情,之前看的都断片了,又翻了一遍才勉强回忆起来,最近看论文也基本是粗读,因为总想着尽快着手做自己的东西。 目录数据集综述组内时序论文调研研究生时期 ......
时序 图谱 模型 知识

螺旋模型

......
螺旋 模型

记录TritonServer部署多模型到多GPU踩坑 | 京东云技术团队

一、问题是怎么发现的 部署chatglm2和llama2到一个4*V100的GPU机器上遇到问题 config.pbtxt 中设置模型分别在指定gpu上部署实例配置不生效 如以下配置为在gpu0上部署本模型,部署count=1个实例,在gpu1上部署本模型,部署count=2个实例 instance ......
TritonServer 模型 团队 技术 GPU

【Python&语义分割】Segment Anything(SAM)模型交互式分割+掩膜保存(三)

我之前分享了Segment Anything(SAM)模型的基本操作,这篇给大家分享下交互式语义分割代码,可以通过鼠标点击目标物生成对应的掩膜,同时我还加入了掩膜保存的代码。 ......
掩膜 语义 交互式 Anything 模型

专注二次元的 Niji 模型上线独立 APP;华为整体销量已超越苹果丨 RTE 开发者日报 Vol.68

开发者朋友们大家好: 这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留 ......
开发者 销量 模型 整体 苹果

PRCV 2023:语言模型与视觉生态如何协同?合合信息瞄准“多模态”技术

PRCV 2023:语言模型与视觉生态如何协同?合合信息瞄准“多模态”技术 近期,2023年中国模式识别与计算机视觉大会(PRCV)在厦门成功举行。大会由中国计算机学会(CCF)、中国自动化学会(CAA)、中国图象图形学学会(CSIG)和中国人工智能学会(CAAI)联合主办,多媒体可信感知与高效计算 ......
模态 模型 视觉 生态 语言

VS2019连接MySql使用实体数据模型(EF实体映射)【解决创建闪退问题】

一、确定MySQL Connector Net 版本 如果没有请下载 下载驱动: mysql-connector-odbc-8.0.20-winx64.msimysql odbc驱动 mysql-for-visualstudio-1.2.9.msiVisual Studio连接MySQL工具 mys ......
实体 模型 数据 问题 MySql

倾斜摄影三维模型的根节点合并的重要性分析

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作,从而实现三维模型轻量化。轻量化压缩比大,模型轻量化效率高,自动化处理能力高;采用多种算法对三维模型进行几何精纠正处理,精度高,... ......
节点 重要性 模型

大模型微调方法总结

大模型微调方法总结 参考链接:https://blog.csdn.net/v_JULY_v/article/details/132116949 前言:随着chatGPT的备受欢迎,大模型异常火爆,各大厂商相继推出自己的大模型。 二级公司和用户需要根据自身的垂直领域微调这些具有语义理解能力的大模型,以 ......
模型 方法

R语言中的Stan概率编程MCMC采样的贝叶斯模型|附代码数据

原文链接:http://tecdat.cn/?p=11161 最近我们被客户要求撰写关于贝叶斯模型的研究报告,包括一些图形和统计输出。 概率编程使我们能够实现统计模型,而不必担心技术细节。这对于基于MCMC采样的贝叶斯模型特别有用 R语言中RStan贝叶斯层次模型分析示例 stan简介 Stan是用 ......
概率 模型 语言 代码 数据

R语言面板数据回归:含时间固定效应混合模型分析交通死亡率、酒驾法和啤酒税

全文链接:https://tecdat.cn/?p=33874 原文出处:拓端数据部落公众号 面板数据回归可以缓解省略变量偏误的问题,特别是当没有既与感兴趣的回归变量相关又与依赖变量相关的变量信息时,并且这些变量在时间或实体维度上是恒定的。 当客户有面板数据可用时,可以使用面板回归方法来改善多元回归 ......
死亡率 效应 面板 啤酒 模型

增量模型

......
增量 模型

prompt提示工程/diffusion扩散模型/datawhale组队学习///day1 看直播

今日学习来源【纯干货】提示工程(Prompt Engineering)- AI编程新范式_哔哩哔哩_bilibili 抄一下评论区的课代表: - 0:00 📚共识扩散模型学习活动- 6:57 🛠️大圆模型和提示工程- 13:53 💬语言模型和大语言模型- 20:49 🔬GBT3.5和深度学习 ......
diffusion datawhale 模型 prompt 工程

瀑布模型

......
瀑布 模型

数据库系统笔记 - chap2 - 关系模型

关系数据结构 关系代数 A set of fundamental operations to retrieve and manipulate tuples in a relation. These operations take one or some relations as inputs, an ......
模型 数据库 笔记 数据 系统

1.绪论+2.模型评估与选择

1. 绪论 学到什么程度: 1.1 基本术语 特征:反映事件或对象在某方面的表现或性质的事项,例如"色泽""根蒂" "敲声",称为"属性" (attribute) 或"特征" (feature); 样本空间:属性张成的空间称为"属性空间" (attribute space) "样本空间" (samp ......
绪论 模型

pyspark 常用Transform算子

from pyspark import SparkConf, SparkContext conf = SparkConf().setAppName("test_SamShare").setMaster("local[4]") sc = SparkContext(conf=conf) # 1.map对 ......
算子 Transform 常用 pyspark

行行AI直播预告:百度世界大会2023-大模型驱动产业发展论坛

10月17日,1000万人关注的“百度世界大会2023”将在北京首钢园拉开帷幕。本届大会以“生成未来(PROMPT THE WORLD)”为主题,将集中展示百度在大模型等领域的最新技术和产品。 作为大会的重要组成部分,“大模型驱动产业发展论坛”将在当天下午开启,以大模型为核心的高阶生产力将带来全新的 ......
产业发展 模型 大会 产业 世界

树叶识别系统python+Django网页界面+TensorFlow+算法模型+数据集+图像识别分类

一、介绍 树叶识别系统。使用Python作为主要编程语言开发,通过收集常见的6中树叶('广玉兰', '杜鹃', '梧桐', '樟叶', '芭蕉', '银杏')图片作为数据集,然后使用TensorFlow搭建ResNet50算法网络模型,通过对数据集进行处理后进行模型迭代训练,得到一个识别精度较高的H ......
算法 树叶 TensorFlow 模型 图像

各神经网络模型全称

博客地址:https://www.cnblogs.com/zylyehuo/ 人工神经网络 -- ANN -- Artificial Neural Networks 卷积神经网络 -- CNN -- Recurrent NeConvolutional Neural Networks 递归(循环)神经 ......
神经网络 全称 模型 神经 网络

基于深度学习框架的基因组预测新模型SoyDNGP

目录简介材料方法数据集SoyDNGP的模型结构比对模型的处理主要结果SoyDNGP在大豆基因组预测中展现了出色的能力大豆基因组预测中SoyDNGP与其他算法的性能比较SoyDNGP模型在不同大豆群体中的多功能预测能力SoyDNGP 在大豆之外的广泛应用SoyDNGP是一个面向大豆基因组预测的开放友好 ......
基因组 基因 框架 深度 模型

Graph Wave Net模型中的数据集hdf5和pkl文件的读取问题

引入:GraphWaveNet的流量数据的文件格式是.h5,路网结构文件格式是.pkl,它们怎么打开呢? HDF5 HDF5文件一般以 .h5 或者 .hdf5 作为后缀名,其中包含两种结构:Group(文件夹)和Datasets(数据) python可以使用 h5py 或 pandas 打开.h5 ......
模型 文件 数据 问题 Graph

Security Reduction学习笔记(1):密码系统与安全模型的定义

课件地址:Book (uow.edu.au),原作者声明该课件对人类和外星人免费开放 ( ̄_ ̄|| ) 现代密码学概念: 现代密码学与经典密码学的区别在于它强调定义(definitions)、模型(models)和证明(proofs). 定义澄清:密码学(Cryptology)= 设计密码学(Cry ......
Reduction Security 模型 密码 笔记

Transformer

自注意力机制(self-attention) 一堆向量 a set of vector : 词语、图(每个节点可以看作一个向量) 一对一:Sequence Labeling self-attention会吃一整个sequence的咨询 全连接是定长的,attention是不定长的 α计算关联性(自己 ......
Transformer

PyTorch之线性回归模型

1 简介 1.1 线性回归模型简介 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = wx+e,e为误差服从均值为0的正态分布。其中只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,称为一元线性回归。 1 ......
线性 模型 PyTorch

车辆车型识别系统python+TensorFlow+Django网页界面+算法模型

一、介绍 车辆车型识别系统。本系统使用Python作为主要开发编程语言,通过TensorFlow搭建算法模型网络对收集到的多种车辆车型图片数据集进行训练,最后得到一个识别精度较高的模型文件。并基于该模型搭建Django框架的WEB网页端可视化操作界面。实现用户上传一张车辆车型图片识别其名称。 二、系 ......
算法 TensorFlow 车型 模型 界面

python学习——回归模型

从本篇开始记录一下我在研究生阶段的学习 作业之成人死亡率预测(回归模型) 1 实验介绍 1.1 实验背景 成年人死亡率指的是每一千人中15岁至60岁死亡的概率(数学期望)。这里我们给出了世界卫生组织(WHO)下属的全球卫生观察站(GHO)数据存储库跟踪的所有国家健康状况以及许多其他相关因素。要求利用 ......
模型 python