transformer tensorflow pytorch gpt

windows安装tensorflow-gpu / CUDA / cuDNN

最终安装内容：windows10 + 3060显卡 + tensorflow-gpu 2.10.0 + CUDA 11.2 + cuDNN 8.1 1. 命令行输入nvidia-smi，查看显卡对应的cuda版本。如下图，CUDA Version为12.1，则安装的CUDA版本不能高于12.1。 2 ......

tensorflow-gpu tensorflow windows cuDNN CUDA更新时间 2023-12-14

TensorFlow GPU支持

Compute Capability > 3.5 NVIDIA 驱动版本 > 450.0.20 查看驱动版本 nvidia-smi ......

TensorFlow GPU更新时间 2023-12-14

【学习笔记】transformer 简札

高铁心血来潮逼着自己把这个模型的结构看了一遍，不写下来会忘掉的 Encoder 输入是词向量。 word vector -> [(multihead) self-attention -> forward ]×n-> layer normalization self attention 就是 qkv矩 ......

transformer 笔记更新时间 2023-12-13

Swin Transformer 马尔奖论文（ICCV 2021最佳论文）

目录简介作者之一的微软亚研院的首席研究员胡瀚老师在bibili讲过该论文 swin transformer比ViT做的更好的原因之一就是它将图片的一些特性嵌入到了网络模型之中，比如说平移不变性和尺寸不变性等，这样使得网络能够在cv领域做的更好。该文章提出的Swin Transformer可以被 ......

论文 Transformer Swin ICCV 2021更新时间 2023-12-13

MIT斯坦福Transformer最新研究：过度训练让中度模型「涌现」结构泛化能力

前言过度训练让中度模型出现了结构泛化能力。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指导班、基础入门班、论文指导班全 ......

Transformer 模型能力结构 MIT更新时间 2023-12-12

GPT-4「变懒」问题将被修复；英伟达选择越南成公司“第二故乡”丨 RTE 开发者日报 Vol.104

开发者朋友们大家好：这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE （Real Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表 ......

开发者故乡日报问题公司更新时间 2023-12-12

使用ubuntu根据cuda11.2安装pytorch

在使用镜像新建了一个cuda11.2-python3.9 容器配置环境的过程中需要安装PyTorch。一开始我直接使用 pip install torch 来进行安装，但是运行程序时出现报错： RuntimeError: The NVIDIA driver on your system is too ......

pytorch ubuntu cuda 11.2 11更新时间 2023-12-12

transformer模型

Transformer由谷歌团队在论文《Attention is All You Need》提出，是基于attention机制的模型，最大的特点就是全部的主体结构均为attention。以下部分图片来自论文，部分图片来自李宏毅老师的transformer课程课程链接：强烈推荐！台大李宏毅自注意力 ......

transformer 模型更新时间 2023-12-12

Transformer架构在大型语言模型(LLM)中的应用与实践

Transformer架构是当今最前沿的语言模型技术之一，它已经在谷歌的BERT、OpenAI的GPT系列中取得了显著的成就。这一架构之所以独特，是因为它打破了传统的序列处理模式，引入了创新的“自注意力”机制。 Transformer架构的核心是自注意力机制，它使模型能够识别和重视输入数据中不同部分 ......

Transformer 架构模型语言 LLM更新时间 2023-12-12

GPT会让程序员失业么？

今天问了GPT一个问题，他的回答让我感到有些惊讶！问题帮我用DDD实现一个简单的接收邮件的程序回复当使用领域驱动设计（DDD）时，我们通常要从领域模型和业务需求出发来设计系统。在一个简单的接收邮件程序中，我们可以考虑以下步骤：确定领域：首先，确定系统的核心领域。在这个场景中，领域可以是" ......

程序员程序 GPT更新时间 2023-12-12

pytorch——房价预测

1、首先对数据进行读取和预处理 2、读取数据后，对x数据进行标准化处理，以便于后续训练的稳定性，并转换为tensor格式 3、接下来设置训练参数和模型这里采用回归模型，既y=x*weight1+bias1，设置的学习率为0.0006，损失函数采用了MSE（均方误差） 4、绘制图像由于数据量较少， ......

房价 pytorch更新时间 2023-12-12

[论文阅读] Replacing softmax with ReLU in Vision Transformers

Pre title: Replacing softmax with ReLU in Vision Transformers accepted: Arxiv 2023 paper: https://export.arxiv.org/abs/2309.08586 code: None 关键词：atten ......

Transformers Replacing softmax Vision 论文更新时间 2023-12-12

【Pytorch基础实战】第一节，BP神经网络

项目地址 https://gitee.com/wxzcch/pytorchbase/tree/master/leason_1 实现代码 import pandas as pd import torch import torch.nn as nn import torch.optim as optim ......

神经网络实战神经 Pytorch 基础更新时间 2023-12-12

【开源项目推荐】-支持GPT的智能数据库客户端与报表工具——Chat2DB

2023年是人工智能爆火的一年，ChatGPT为首的一系列的大模型的出现，让生成式人工智能彻底火了一把。但有人会说，GPT对于我们数据开发来说并没有什么作用啊？今天为大家推荐的开源项目，就是GPT在数据领域的一个优秀实践项目。让我们一起来看看吧~ Chat2DB是一个集成了ChatGPT功能的数据 ......

项目推荐报表客户端 Chat2DB 客户更新时间 2023-12-12

使用 PyTorch FSDP 微调 Llama 2 70B

引言通过本文，你将了解如何使用 PyTorch FSDP 及相关最佳实践微调 Llama 2 70B。在此过程中，我们主要会用到 Hugging Face Transformers、Accelerate 和 TRL 库。我们还将展示如何在 SLURM 中使用 Accelerate。完全分片数据并 ......

PyTorch Llama FSDP 70B 70更新时间 2023-12-12

unity Transform 的 Rotate(xAngle: float, yAngle: float, zAngle: float, relativeTo: Space = Space.Self, Space.World); 刨根问底

public class demoword2 : MonoBehaviour { // Start is called before the first frame update void Start() { //transform.Rotate(60, 70, 80, Space.World); ......

Space float 刨根问底 relativeTo Transform更新时间 2023-12-11

使用PyTorch II的新特性加快LLM推理速度

Pytorch团队提出了一种纯粹通过PyTorch新特性在的自下而上的优化LLM方法，包括: Torch.compile: PyTorch模型的编译器 GPU量化:通过降低精度操作来加速模型推测解码:使用一个小的“草稿”模型来加速llm来预测一个大的“目标”模型的输出张量并行:通过在多个设备上运 ......

特性速度 PyTorch LLM更新时间 2023-12-11

基于Transformer的遥感影像目标检测研究

基于Transformer的遥感影像目标检测研究 1. 研究课题三要素 1.1 研究对象遥感影像。 1.2 研究问题目标检测任务指的是为每个感兴趣的对象预测一组边界框和类别标签。与自然场景下的通用目标检测不同，遥感影像存在一些自身的特点，例如遥感图像幅面大、成像视角单一、可提取的特征较少；目标数 ......

遥感 Transformer 影像目标更新时间 2023-12-11

人工智能学习二、tensorflow快速入门

一、项目流程数据预处理-》模型训练-》模型保存-》模型预测二、要点：数据类型运行机制数据IO 模型训练模型保存模型调用三、编写tensorflow的两个步骤：（1）构建计算图graph graph中包含tensor和operation tensor:类型化的多维数组 operati ......

人工智能 tensorflow 人工智能更新时间 2023-12-10

Retentive Networks Meet Vision Transformers，视觉RetNet

alias: Fan2023 tags: RetNet rating: ⭐ share: false ptype: article RMT: Retentive Networks Meet Vision Transformers 初读印象 comment:: (RMT)Retentive Netwo ......

Transformers Retentive Networks 视觉 RetNet更新时间 2023-12-10

关于GPT4给我的GATK joint calling（多项目不同批次大规模合并）建议

目录问答1问答2问答3问答4问答5问答6问答7问答8问答9问答10 关于生物信息的专业回答与建议，GPT4刷新了我对它的认知。详见如下对话：问答1 问答2 问答3 问答4 问答5 反过来又测试它一下。问答6 会通过Bing联网进行检索。问答7 问答8 问答9 会联网进行检索。问答10 不得 ......

批次大规模 calling 建议项目更新时间 2023-12-10

我用GPTs创建了一个私有的育种GPT应用

目录前不久openAI开放了GPT-4-Turbo、GPT-4-Vision等模型api，还发布了GPTs，使得用户能够根据需要定义自己的GPT应用。不到一周的时间，各种定制GPT全球大爆发，增长速度超乎想象：几乎每分钟诞生一个新的GPT！正如Altman在开发者大会上所说：我们正在孕育新物种， ......

GPTs GPT更新时间 2023-12-10

CentOS的GPT分区+LVM挂载

为突破MBR分区限制（最大卷：2T，最多4个主分区或3个主分区加一个扩展分区）常常以GPT分区方式（突破MBR 4个主分区限制，每个磁盘最多支持128个分区，支持大于2T的分区，最大卷可达18EB）新建分区并挂载，下面记录自己常用的GPT+LVM的方式挂载新的硬盘的方式。 1.查看硬盘标签使用fd ......

CentOS GPT LVM更新时间 2023-12-10

在pytorch中保存模型或模型参数

在 PyTorch 中，我们可以使用 torch.save 函数将 PyTorch 模型保存到文件。这个函数接受两个参数：要保存的对象（通常是模型），以及文件路径。保存模型参数 import torch import torch.nn as nn # 假设有一个简单的模型 class Simple ......

模型参数 pytorch更新时间 2023-12-08

遥遥领先GPT-4！谷歌最强AI大模型Gemini 1.0发布

在5月举行的开发者大会上，谷歌首次透露其正在开发的AI大模型Gemini，时隔7个月，Gemini终于来了。据谷歌官方公众号消息，谷歌日前正式发布Gemini 1.0，这是谷歌迄今为止构建的最强大、最通用、最灵活的模型。据介绍，针对不同场景，谷歌发布了三种不同版本： Gemini Ultra：谷 ......

模型 Gemini GPT 1.0更新时间 2023-12-08

语言模型：GPT与HuggingFace的应用

本文分享自华为云社区《大语言模型底层原理你都知道吗？大语言模型底层架构之二GPT实现》，作者：码上开花_Lancer 。受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型微调的范式影响，自然语言处理领域基于预训练语言 ......

HuggingFace 模型语言 GPT更新时间 2023-12-08

深入解析LLaMA如何改进Transformer的底层结构

本篇文章将以LLaMA 模型为例，介绍大语言模型架构在Transformer 原始结构上的改进，并介绍Transformer 模型结构中空间和时间占比最大的注意力机制优化方法。 ......

底层 Transformer 结构 LLaMA更新时间 2023-12-07

人工智能学习一、使用miniconda安装tensorflow

1、conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --set show_channel_urls yes 用户目录底下找到 .condarc 文件，打 ......

人工智能 tensorflow miniconda 人工智能更新时间 2023-12-06

Databend 如何利用 GPT-4 进行质量保证

背景在数据库行业，质量是核心要素。 Databend 的应用场景广泛，特别是在金融相关领域，其查询结果的准确性对用户至关重要。因此，在快速迭代的过程中，如何确保产品质量，成为我们面临的重大挑战。随着 Databend 开源社区的快速发展，新功能的持续增加和现有功能的优化提出了新的测试挑战。我们致 ......

质量保证 Databend 质量 GPT更新时间 2023-12-06

svg transform总结

1. svg的transform和dom的不同，旋转中心不是默认自身，而是画布左上角 2. svg要以自身为中心旋转，可以使用rotate(angle [x y]), 比css的rotate(angel)多了x,y两个参数，x,y分别设置为svg图形的中心点坐标即可 3. 线性变换 translat ......

transform svg更新时间 2023-12-06

共1660篇 :5/56页 首页上一页2345678下一页尾页