pytorch

Pytorch中的交叉熵CE和均方误差MSE分别是如何计算的?

本文主要关注输入输出的形状,通过两种标签形式探索一下其计算机制。 交叉熵损失函数 实验设置:假设采用AutoEncoder+分类器。AE负责重构图像,计算MSE。分类器通过latent vector计算23个类别的概率向量。 import torch nn as nn net = AutoEncod ......
误差 Pytorch MSE

PyTorch项目源码学习(2)——Tensor代码结构初步学习

PyTorch版本:1.10.0 Tensor Tensor是Pytorch项目较为重要的一部分,其中的主要功能如存储,运算由C++和CUDA实现,本文主要从前端开始探索学习Tensor的代码结构。 结构探索 PyTorch前端位于torch目录下,从_tensor.py可以找到Tensor的pyt ......
源码 PyTorch 结构 代码 项目

使用PyTorch实现混合专家(MoE)模型

Mixtral 8x7B 的推出在开放 AI 领域引发了广泛关注,特别是混合专家(Mixture-of-Experts:MoEs)这一概念被大家所认知。混合专家(MoE)概念是协作智能的象征,体现了“整体大于部分之和”的说法。MoE模型汇集了各种专家模型的优势,以提供更好的预测。它是围绕一个门控网络 ......
模型 PyTorch 专家 MoE

安装pytorch/安装jupyterlab并添加已创建环境的kernel

安装pytorch 先创建一个环境,去pytorch官网查找环境所用python版本对应的torch版本,并选择合适的下载命令,在已激活的环境中运行命令,即可安装成功。 安装jupyter jupyter可以按cell运行代码,并且可以边写代码边做笔记。运行conda install jupyter ......
jupyterlab pytorch 环境 kernel

挑战Transformer的新架构Mamba解析以及Pytorch复现

今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模” Mamba一直在人工智能界掀起波澜,被吹捧为Transformer的潜在竞争对手。到底是什么让Mamba在拥挤的序列建中脱颖而出? 在介绍之前先简要回顾一下现有的模型 Transformer:以其注意力机制而闻名,其中序 ......
Transformer 架构 Pytorch Mamba

PyTorch 的 BatchNorm 层

BatchNorm 层 为了实现输入特征标准化,batch norm 层会维护一个全局均值 running_mean 和全局方差 running_var。网络 train() 时进行统计,eval() 时使用统计值。 除此之外,可选 weight 权重和 bias 权重,这两个权重是会持续参与到网络 ......
BatchNorm PyTorch

Pytorch深度学习入门

一、配环境 创建环境 在Anaconda中输入 conda create -n pytorch python=3.6 ......
深度 Pytorch

SciTech-BigDataAIML-PyTorch: 安装PyTorch For Python3.12

安装PyTorch For Python3.12: Release Version: $ pip install torch torchvision torchaudio Pre-Release Version: $ pip install --pre torch torchvision torch ......

使用PyTorch实现去噪扩散模型

在深入研究去噪扩散概率模型(DDPM)如何工作的细节之前,让我们先看看生成式人工智能的一些发展,也就是DDPM的一些基础研究。 VAE VAE 采用了编码器、概率潜在空间和解码器。在训练过程中,编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进行采样,并将其传递到解码器中,其中输入的图像预计 ......
模型 PyTorch

环境配置问题一些注意的点(Pytorch+cudnn)

1、先安装好Pycharm以及Anaconda 我使用的是Python3.6版本,所以下载了与Python3.6对应的Anaconda,Pycharm下载的是社区版; 2、cudnn版本:首先查看自己电脑NVIDIA版本,从任务管理器中查看GPU型号,再从cudnn官网下载相关配件; 3、在note ......
Pytorch 环境 问题 cudnn

Window10安装PyTorch

1、参考地址 https://blog.csdn.net/Mind_programmonkey/article/details/99688839 2、安装pytorch-gpu时,网络不好的话可以开手机热点,然后进行下载安装 activate conda activate python3.8 pip ......
PyTorch Window 10

pytorch反向传播错误解决:RuntimeError: Trying to backward through the graph a second time, but the buffers have already been freed. Specify retain_graph=True when calling backward the first time.

pytorch反向传播错误解决: 错误: RuntimeError: Trying to backward through the graph a second time, but the buffers have already been freed. Specify retain_graph=T ......
backward the graph time RuntimeError

python(pytorch)学习中的法宝

1、dir():打开、查看 比方在Pycharm中输入dir(torch),就可以输出torch中所有的使用方法(函数) 2、help(函数名):对于新手来讲很有用,函数不知道怎么用的时候,可以用该函数调出函数的使用参考。 3、dataset:提供一种方式去获取数据及其label(如何获取每一个数据 ......
法宝 pytorch python

Pytorch distributed overview

torch.distributed 包 v1.6.0后包括三个主要的部分: 1.Distributed Data-Parallel Training(DDP):单程序多数据训练范式。模型被复制到每个进程中,每个模型副本被提供一组不同的输入数据,并将其梯度计算累加以加快训练速度。(collective ......
distributed overview Pytorch

深度解析 PyTorch Autograd:从原理到实践

本文深入探讨了 PyTorch 中 Autograd 的核心原理和功能。从基本概念、Tensor 与 Autograd 的交互,到计算图的构建和管理,再到反向传播和梯度计算的细节,最后涵盖了 Autograd 的高级特性。 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、A ......
深度 Autograd 原理 PyTorch

使用pytorch构建图卷积网络预测化学分子性质

在本文中,我们将通过化学的视角探索图卷积网络,我们将尝试将网络的特征与自然科学中的传统模型进行比较,并思考为什么它的工作效果要比传统的方法好。 https://avoid.overfit.cn/post/7cfa0930651b4b4cac912952d8c53d54 ......
图卷 分子 性质 pytorch 化学

基于Pytorch的网络设计语法4

import torch.nn as nn import torch.functional as F import torch.optim as optim from collections import OrderedDict class Net4(nn.Module):# 从nn.Module ......
语法 Pytorch 网络

基于Pytorch的网络设计语法3

import torch.nn as nn import torch.functional as F import torch.optim as optim from collections import OrderedDict class Net3(nn.Module):# 从nn.Module ......
语法 Pytorch 网络

基于Pytorch的网络设计语法2

import torch.nn as nn import torch.functional as F import torch.optim as optim from collections import OrderedDict class Net2(nn.Module):# 从nn.Module ......
语法 Pytorch 网络

基于Pytorch的网络设计语法1

第一种语法: 层层堆叠 import torch.nn as nn import torch.functional as F import torch.optim as optim from collections import OrderedDict class Net1(nn.Module):# ......
语法 Pytorch 网络

【pytorch深度学习报错】AttributeError: module 'torch' has no attribute '_six'

1.AttributeError: module 'torch' has no attribute '_six'报错: 答:指的是安装的pytorch版本里面没有_six.py文件,因为在pytorch2.0版本以后不在具有此文件。 2.两个解决方法 答:①将2.0版本以前的_six.py文件复制到 ......
39 AttributeError attribute 深度 pytorch

PyTorch 神经网络基础

模型构造 在代码里 任何一个层或者神经网络都应该是Module的子类 通过继承nn.Module 可以更灵活的去自定义我们的操作 参数管理 自定义层 带参数的层需要给出输入的维度和输出的维度 读写文件 ......
网络基础 神经 PyTorch 基础 网络

PyTorch 系列

PyTorch【】-模型保存、加载、加载内置模型 PyTorch 模型所有属性 及 应用 PyTorch 形变操作汇总(包括形状、维度、合并拆分等) PyTorch-优化器optim与学习率 PyTorch-池化 PyTorch【】-tensoboard 详解 PyTorch-function 之 ......
PyTorch

pytorch转onnx中关于卷积核的问题

pytorch导出onnx过程中报如下错误: RuntimeError: Unsupported: ONNX export of convolution for kernel of unknown shape. 我报错的部分代码如下: def forward(self, input): n, c, ......
卷积 pytorch 问题 onnx

快速使用 Pytorch 的混合精度进行训练

使用混合精度的代码示例 以非常基础的训练代码片段为例: for epoch in range(epochs): model.train() for i, (images, labels) in enumerate(loader_train): images = images.to(device) l ......
精度 Pytorch

PYTORCH基础(15)torch.nn库五大基本功能:nn.Parameter、nn.Linear、nn.functioinal、nn.Module、nn.Sequentia

第1章 torch.nn简介 1.1 torch.nn相关库的导入 #环境准备 import numpy as np # numpy数组库 import math # 数学运算库 import matplotlib.pyplot as plt # 画图库 import torch # torch基础 ......
nn functioinal Parameter Sequentia PYTORCH

基于pytorch写一个三层神经网络,训练数据并导出模型

import torch import torch.nn as nn import torch.optim as optim # 定义三层神经网络 class ThreeLayerNN(nn.Module): def __init__(self, input_size, hidden_size1, ......
神经网络 模型 神经 pytorch 数据

Pytorch模型结构修改

1. Var方差在pytorch中的差别: tlist = input.tolist() print(input) print(np.mean(tlist), np.var(tlist)) print(torch.mean(input), torch.var(input)) 可以看到numpy与to ......
模型 Pytorch 结构

pytorch——基于循环神经网络的情感分类

任务目标 基于给定数据集,进行数据预处理,搭建以LSTM为基本单元的模型,以Adam优化器对模型进行训练,使用训练后的模型进行预测并计算预测分类的准确率。 数据集信息 IMDB数据集是一个对电影评论标注为正向评论与负向评论的数据集,共有25000条文本数据作为训练集,25000条文本数据作为测试集。 ......
神经网络 神经 pytorch 情感 网络

从分布式计算的角度看pytorch和TensorFlow哪个更优?

背景: pytorch框架是一个从学术圈出来的框架,因此pytorch并不原生支持分布式计算,而且在大模型火爆的今年以外好像在深度学习领域使用分布式计算的场景确实不多,所以pytorch并不原生支持分布式计算的事情好像也并无大碍,而且pytorch可以通过安装第三方库的方式实现同步形式的分布式计算。 ......
分布式 TensorFlow 角度 pytorch
共551篇  :1/19页 首页上一页1下一页尾页