pytorch

刘老师《Pytorch深度学习实践》第三讲:梯度下降

1.分治法不能用 局部点干扰性大 2.梯度下降 3. 随机梯度下降 随机梯度下降法(Stochastic Gradient Descent, SGD):由于批量梯度下降法在更新每一个参数时,都需要所有的训练样本,所以训练过程会随着样本数量的加大而变得异常的缓慢。随机梯度下降法正是为了解决批量梯度下降 ......
梯度 三讲 深度 Pytorch 老师

Transoformer Pytorch实现

LayerNorm层 作用 BatchNorm计算的是一批样本,样本间同一个通道进行正则化 LayerNorm计算的是一个样本内,一个样本内进行正则化。 实现代码 class LayerNorm(nn.Module): def __init__(self,features,eps=1e-6): su ......
Transoformer Pytorch

全面掌握胶囊网络:从基础理论到PyTorch实战

本文全面深入地探讨了胶囊网络(Capsule Networks)的原理、构建块、数学模型以及在PyTorch中的实现。通过本文,读者不仅能够理解胶囊网络的基础概念和高级数学原理,还能掌握其在实际问题中的应用方法。 关注TechLead,分享AI与云服务技术的全维度知识。作者拥有10+年互联网服务架构 ......
基础理论 胶囊 实战 PyTorch 理论

ResNet详解:网络结构解读与PyTorch实现教程

本文深入探讨了深度残差网络(ResNet)的核心概念和架构组成。我们从深度学习和梯度消失问题入手,逐一解析了残差块、初始卷积层、残差块组、全局平均池化和全连接层的作用和优点。文章还包含使用PyTorch构建和训练ResNet模型的实战部分,带有详细的代码和解释。 关注TechLead,分享AI与云服 ......
PyTorch 结构 教程 ResNet 网络

pytorch:1.12-gpu-py39-cu113-ubuntu20.04

docker-compose 安装 unbuntu 20.04 version: '3' services: ubuntu2004: image: ubuntu:20.04 ports: - '2256:22' - '3356:3306' - '8058:80' volumes: - my-volu ......
pytorch gpu-py ubuntu 20.04 1.12

《动手学深度学习 Pytorch版》 10.7 Transformer

自注意力同时具有并行计算和最短的最大路径长度这两个优势。Transformer 模型完全基于注意力机制,没有任何卷积层或循环神经网络层。尽管 Transformer 最初是应用于在文本数据上的序列到序列学习,但现在已经推广到各种现代的深度学习中,例如语言、视觉、语音和强化学习领域。 10.7.1 模 ......
Transformer 深度 Pytorch 10.7 10

anaconda+pytorch+pycharm

1、安装anaconda,使用conda新建虚拟环境 conda create -n pytorch python=3.9 numpy matplotlib pandas jupyter notebook(环境名为pytorch) conda activate pytorch conda deact ......
anaconda pytorch pycharm

一文搞懂深度信念网络!DBN概念介绍与Pytorch实战

本文深入探讨了深度信念网络DBN的核心概念、结构、Pytorch实战,分析其在深度学习网络中的定位、潜力与应用场景。 关注TechLead,分享AI与云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师 ......
实战 深度 信念 概念 Pytorch

解密长短时记忆网络(LSTM):从理论到PyTorch实战演示

本文深入探讨了长短时记忆网络(LSTM)的核心概念、结构与数学原理,对LSTM与GRU的差异进行了对比,并通过逻辑分析阐述了LSTM的工作原理。文章还详细演示了如何使用PyTorch构建和训练LSTM模型,并突出了LSTM在实际应用中的优势。 关注TechLead,分享AI与云服务技术的全维度知识。 ......
长短 实战 记忆 PyTorch 理论

PyTorch+昇腾 共促AI生态创新发展

原文链接: https://mp.weixin.qq.com/s/s8jNzTo0DM_LjyUwYDVgGg 2023年10月5日(北京时间),PyTorch社区正式发布2.1版本,经过PyTorch社区与昇腾的持续合作和共同努力,Pytorch 2.1版本已同步支持昇腾NPU,意味着开发者可直接 ......
生态 PyTorch

pytorch(10.2) 自注意力理论 固定C变化到可变C

1早先的预测模型 让我们首先定义预测函数来生成prefix之后的新字符, 其中的prefix是一个用户提供的包含多个字符的字符串。 在循环遍历prefix中的开始字符时, 我们不断地将隐状态传递到下一个时间步,但是不生成任何输出。 这被称为预热(warm-up)期, 因为在此期间模型会自我更新(例如 ......
注意力 pytorch 理论 10.2 10

《动手学深度学习 Pytorch版》 10.3 注意力评分函数

上一节使用的高斯核的指数部分可以视为注意力评分函数(attention scoring function),简称评分函数(scoring function)。 后续把评分函数的输出结果输入到softmax函数中进行运算。最后,注意力汇聚的输出就是基于这些注意力权重的值的加权和。该过程可描述为下图: ......
注意力 函数 深度 Pytorch 10.3

《动手学深度学习 Pytorch版》 10.2 注意力汇聚:Nadaraya-Watson 核回归

import torch from torch import nn from d2l import torch as d2l 1964 年提出的 Nadaraya-Watson 核回归模型是一个简单但完整的例子,可以用于演示具有注意力机制的机器学习。 10.2.1 生成数据集 根据下面的非线性函数生 ......

用pytorch 2.1 加速 numpy 代码

参考 https://pytorch.org/blog/compiling-numpy-code/ 在mac M2 机器上, 快了50%, 但没有好几倍。可能和依赖libomp有关 brew install libomp python test_np.py test_np.py 代码如下 impor ......
pytorch 代码 numpy 2.1

pytorch(10.5) Transformer 用到视觉模块

ViT| Vision Transformer |理论 + 代码_哔哩哔哩_bilibili 1 不用卷积神经网络那些东西(CNN)了全部用Transforme 。 2 大规模数据训练,小规模数据应用。 3 效果相当 计算训练资源更少。 转换思想 224*224像素图像 - 单个像素(视为一个词to ......
Transformer 模块 视觉 pytorch 10.5

pytorch(10.4) 多层堆叠

多层堆叠 多头得到到多个结果 z1 z2 z1 z2经过 feed forward neural network网络 全连接层得到向量r1 r2. 既然是向量,就可以重复输入网络了 然后就可以重复堆积层了。 layernorm 应用了残差网络思想(确保加的层不会导致比原来系统差) 1 加操作:输出+ ......
多层 pytorch 10.4 10

pytorch(10.3) 多头注意

10.5. 多头注意力 — 动手学深度学习 2.0.0 documentation (d2l.ai) Multi-Head Attention | 算法 + 代码_哔哩哔哩_bilibili 代码实现 x[1,4,2] 1几个样本(句子) 4 预测步长(4个单词) 2每个单词的编码后特征长度 ......
多头 pytorch 10.3 10

《动手学深度学习 Pytorch版》 10.1 注意力提示

10.1.1 生物学中的注意力提示 “美国心理学之父” 威廉·詹姆斯提出的双组件(two-component)框架: 非自主性提示:基于环境中物体的突出性和易见性 自主性提示:受到了认知和意识的控制 10.1.2 查询、键和值 注意力机制与全连接层或汇聚层区别开来的元素:是否包含自主性提示 在注意力 ......
注意力 深度 Pytorch 10.1 10

windows的深度学习环境软件版本(cuda/cudnn/pytorch)

恢复内容开始 为了方便多个深度学习框架的环境配置,推荐使用anoconda进行搭建。 CUDA Toolkit Archive | NVIDIA Developer 恢复内容结束 ......
深度 windows pytorch 版本 环境

Pytorch深度学习环境配置 | NVIDIA-driver + Pytorch + miniconda

为了验证我的环境配置方法没有问题,我特意租了两小时云服务器来从0配置环境。 云服务器厂家:Ucloud ubuntu22.04 3090 * 2 1. 装 NVIDIA-driver 参考:https://zhuanlan.zhihu.com/p/366882419 1.1. 下载驱动 nvidia ......

《动手学深度学习 Pytorch版》 9.8 束搜索

本节将介绍几大: 贪心搜索(greedy search)策略 穷举搜索(exhaustive search) 束搜索(beam search) 9.8.1 贪心搜索 贪心搜索已用于上一节的序列预测。对于输出序列的每一时间步 \(t'\),都从 \(\boldsymbol{Y}\) 中找到具有最高条件 ......
深度 Pytorch 9.8

《动手学深度学习 Pytorch版》 9.6 编码器-解码器架构

为了处理这种长度可变的输入和输出, 可以设计一个包含两个主要组件的编码器-解码器(encoder-decoder)架构: 编码器(encoder):它接受一个长度可变的序列作为输入,并将其转换为具有固定形状的编码状态。 解码器(decoder):它将固定形状的编码状态映射到长度可变的序列。 9.6. ......
编码器 解码器 架构 深度 编码

《动手学深度学习 Pytorch版》 9.7 序列到序列学习(seq2seq)

循环神经网络编码器使用长度可变的序列作为输入,将其编码到循环神经网络编码器固定形状的隐状态中。 为了连续生成输出序列的词元,独立的循环神经网络解码器是基于输入序列的编码信息和输出序列已经看见的或者生成的词元来预测下一个词元。 要点: “<eos>”表示序列结束词元,一旦输出序列生成此词元,模型就会停 ......
序列 seq 深度 Pytorch seq2seq

使用Pytorch Geometric 进行链接预测代码示例

PyTorch Geometric (PyG)是构建图神经网络模型和实验各种图卷积的主要工具。在本文中我们将通过链接预测来对其进行介绍。 链接预测答了一个问题:哪两个节点应该相互链接?我们将通过执行“转换分割”,为建模准备数据。为批处理准备专用的图数据加载器。在Torch Geometric中构建一 ......
示例 Geometric Pytorch 代码 链接

PyTorch大更新,编译代码速度暴增35倍!视觉模型一键部署,头显Quest 3可用

前言 最近,在Pytorch发布会上,发布移动端Pytorch解决方案ExecuTorch,实现在移动端设备上大范围地部署AI工具,并推出最新版本Pytorch2.1,推理速度大幅提升。 本文转载自新智元 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新 ......
模型 视觉 速度 PyTorch 代码

深度学习(pytorch载入onnx测试)

测试模型用之前文章训练的Alexnet模型。 首先将pth文件转为onnx文件: import torch import torch.nn as nn # 自定义AlexNet模型 class AlexNet(nn.Module): def __init__(self): super(AlexNet ......
深度 pytorch onnx

《动手学深度学习 Pytorch版》 9.5 机器翻译与数据集

机器翻译(machine translation)指的是将序列从一种语言自动翻译成另一种语言,基于神经网络的方法通常被称为神经机器翻译(neural machine translation)。 import os import torch from d2l import torch as d2l 9 ......
深度 机器 Pytorch 数据 9.5

《动手学深度学习 Pytorch版》 9.4 双向循环神经网络

之前的序列学习中假设的目标是在给定观测的情况下对下一个输出进行建模,然而也存在需要后文预测前文的情况。 9.4.1 隐马尔可夫模型中的动态规划 数学推导太复杂了,略。 9.4.2 双向模型 双向循环神经网络(bidirectional RNNs)添加了反向传递信息的隐藏层,以便更灵活地处理此类信息。 ......
神经网络 双向 深度 神经 Pytorch

LSTM-CRF模型详解和Pytorch代码实现

在快速发展的自然语言处理领域,Transformers 已经成为主导模型,在广泛的序列建模任务中表现出卓越的性能,包括词性标记、命名实体识别和分块。在Transformers之前,条件随机场(CRFs)是序列建模的首选工具,特别是线性链CRFs,它将序列建模为有向图,而CRFs更普遍地可以用于任意图 ......
LSTM-CRF 模型 Pytorch 代码 LSTM