transformer深度pytorch 10.7

GIS融合之路（二）CesiumJS和ThreeJS深度缓冲区整合

在这篇文章开始前再次重申一下，山海鲸并没有使用ThreeJS引擎。但由于ThreeJS引擎使用广泛，下文中直接用ThreeJS同CesiumJS的整合方案代替山海鲸中3D引擎和CesiumJS整合。系列传送门：山海鲸可视化：GIS融合之路（一）技术选型CesiumJS/loaders.gl/iT ......

缓冲区深度 CesiumJS ThreeJS GIS更新时间 2024-01-13

CF1506D - Epic Transformation

思路用优先队列模拟 ac代码 #include <bits/stdc++.h> using namespace std; using i64 = long long; const i64 inf = 8e18; typedef pair<int, int> pii; const int N = 5 ......

Transformation 1506D 1506 Epic CF更新时间 2024-01-13

backbone、head、neck等深度学习中的术语解释

我们在阅读文章的时候，经常看到backbone head neck 这一类的术语，但是我们可能并不知道是什么意思，这篇文章就是对这些术语进行解释： backbone：翻译为主干网络的意思，既然说是主干网络，就代表其是网络的一部分，那么是哪部分呢？这个主干网络大多时候指的是提取特征的网络，其作用就是 ......

术语深度 backbone head neck更新时间 2024-01-12

提升源代码安全性的C#和Java深度混淆工具——IpaGuard

提升源代码安全性的C#和Java深度混淆工具——IpaGuard 摘要 Ipa Guard是一款功能强大的IPA混淆工具，通过对iOS IPA文件进行混淆加密，保护其代码、资源和配置文件，降低破解反编译难度。本文将介绍Ipa Guard的深度混淆技术，包括逻辑混淆、名称混淆以及处理特殊情况的方法，帮 ......

源代码安全性深度 IpaGuard 工具更新时间 2024-01-12

Pytorch中的交叉熵CE和均方误差MSE分别是如何计算的？

本文主要关注输入输出的形状，通过两种标签形式探索一下其计算机制。交叉熵损失函数实验设置：假设采用AutoEncoder+分类器。AE负责重构图像，计算MSE。分类器通过latent vector计算23个类别的概率向量。 import torch nn as nn net = AutoEncod ......

误差 Pytorch MSE更新时间 2024-01-12

转载：深度学习：蒸馏Distill

转载，写的比较好了，可以参考：https://blog.csdn.net/pipisorry/article/details/117257414 Distilling the knowledge in a neural networkHinton 在论文中提出方法很简单，就是让学生模型的预测分布，来 ......

深度 Distill更新时间 2024-01-12

LLM series: Transformer

🥥 Homepage Dataset, DataLoader, and Transforms Model Traning Model 🥑 Get Started! Import libraries: import torch import torch.nn as nn import torch. ......

Transformer series LLM更新时间 2024-01-12

代码随想录 day16 N 叉树的最大深度完全二叉树的节点个数

N 叉树的最大深度这题昨天做过二叉版本 n叉区别不大完全二叉树的节点个数层级遍历入que的数量就是节点个数 ......

随想录节点随想个数深度更新时间 2024-01-11

深度学习之机器学习理论

（一）机器学习（Machine Learning）：就是让计算机具备从大量数据中学习的能力之一系列方法。机器学习使用很多统计方法，统计学家也称之为统计学习，但本质上起源于计算机科学的人工智能。（二）机器学习的分类：机器学习主要分为两类，即监督学习(supervised learning)与非监督学 ......

深度机器理论更新时间 2024-01-11

Learning Dynamic Query Combinations for Transformer-based Object** Detection and Segmentation论文阅读笔记

Motivation & Intro 基于DETR的目标检测范式（语义分割的Maskformer也与之相似）通常会用到一系列固定的query，这些query是图像中目标对象位置和语义的全局先验。如果能够根据图像的语义信息调整query，就可以捕捉特定场景中物体位置和类别的分布。例如，当高级语义显示图 ......

Transformer-based Combinations Segmentation Transformer Detection更新时间 2024-01-11

[NLP复习笔记] Transformer

1. Transformer 概述 1.1 整体结构 \(\text{Transformer}\) 主要由 \(\text{Encoder}\) 和 \(\text{Decoder}\) 两个部分组成。\(\text{Encoder}\) 部分有 \(N = 6\) 个相同的层，每层包含一个 \( ......

Transformer 笔记 NLP更新时间 2024-01-11

QMap深度拷贝

QMap深度拷贝 #include <QMap> #include <QPair> #include <QDebug> QMap<int, QString> deepCopyQMap(const QMap<int, QString>& source) { QMap<int, QString> tar ......

拷贝深度 QMap更新时间 2024-01-10

【专题】2023年保险合伙人白皮书及优增深度洞察报告PDF合集分享（附原数据表）

原文链接：https://tecdat.cn/?p=34800 原文出处：拓端数据部落公众号 2023年，中国经济从高速向高质量转型，众多保险公司将队伍转型视为寿险行业供给侧改革的关键。以招募和培养专业、职业绩优人才为核心的策略，成为代理人队伍转型的重要方向。阅读原文，获取专题报告合集全文，解锁文末 ......

白皮数据表合伙人白皮书深度更新时间 2024-01-10

PyTorch项目源码学习（2）——Tensor代码结构初步学习

PyTorch版本：1.10.0 Tensor Tensor是Pytorch项目较为重要的一部分，其中的主要功能如存储，运算由C++和CUDA实现，本文主要从前端开始探索学习Tensor的代码结构。结构探索 PyTorch前端位于torch目录下，从_tensor.py可以找到Tensor的pyt ......

源码 PyTorch 结构代码项目更新时间 2024-01-10

深度学习模型部署TensorRT为何如此优秀？

一、前言 PyTorch模型的高性能部署问题，主要关注两个方面：高度优化的算子和高效运行计算图的架构和runtime。python有快速开发以及验证的优点，但是相比C++来说速度较慢而且比较费内存，一般高性能场景都是使用C++去部署，尽量避免使用python环境。 TensorRT为什么那么快，因为 ......

深度 TensorRT 模型更新时间 2024-01-10

使用PyTorch实现混合专家(MoE)模型

Mixtral 8x7B 的推出在开放 AI 领域引发了广泛关注，特别是混合专家（Mixture-of-Experts：MoEs）这一概念被大家所认知。混合专家(MoE)概念是协作智能的象征，体现了“整体大于部分之和”的说法。MoE模型汇集了各种专家模型的优势，以提供更好的预测。它是围绕一个门控网络 ......

模型 PyTorch 专家 MoE更新时间 2024-01-10

安装pytorch/安装jupyterlab并添加已创建环境的kernel

安装pytorch 先创建一个环境，去pytorch官网查找环境所用python版本对应的torch版本，并选择合适的下载命令，在已激活的环境中运行命令，即可安装成功。安装jupyter jupyter可以按cell运行代码，并且可以边写代码边做笔记。运行conda install jupyter ......

jupyterlab pytorch 环境 kernel更新时间 2024-01-09

深度估计之SCDepth系列

SC-Depth系列。 SCDepthV1 之前的单目深度估计网络的重投影损失，更多的是利用前后帧的颜色误差进行约束，得到了比较精确的结果。但它们基本上都有一个共性问题：深度值不连续！连续几张图像之间的深度值不连续！也就是说，在不同的帧上产生尺度不一致的预测，因为它们承受了每帧图像的尺度不确定性。这 ......

深度 SCDepth更新时间 2024-01-09

RNN 和 Transformer 复杂度比较

这里假设BatchSize为 1，就是单样本的情况。原始 RNN 块：（1）单步计算 H，包含两个矩阵向量乘法，和一个激活，复杂度HidSize² （2）一共有SeqLen步，所以整体复杂度SeqLen * HidSize² LSTM 块：（1）单步计算 F I C_hat O，包含八个矩阵向 ......

复杂度 Transformer RNN更新时间 2024-01-09

CUDA驱动深度学习发展 - 技术全解与实战

全面介绍CUDA与pytorch cuda实战关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实验室成员，阿里云认证的资深架构师，项目管理专业人士，上亿营收AI产品研发负责人一、CUDA：定义与演进 CUDA（ ......

实战深度技术 CUDA更新时间 2024-01-09

挑战Transformer的新架构Mamba解析以及Pytorch复现

今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模” Mamba一直在人工智能界掀起波澜，被吹捧为Transformer的潜在竞争对手。到底是什么让Mamba在拥挤的序列建中脱颖而出? 在介绍之前先简要回顾一下现有的模型 Transformer:以其注意力机制而闻名，其中序 ......

Transformer 架构 Pytorch Mamba更新时间 2024-01-09

《Span-Based Joint Entity and Relation Extraction with Transformer Pre-Training》阅读笔记

代码原文地址预备知识： 1.什么是束搜索算法（beam search）? beam search是一种用于许多自然语言处理和语音识别模型的算法，作为最终决策层，用于在给定目标变量(如最大概率或下一个输出字符)的情况下选择最佳输出。 2.什么是条件随机场（Conditional Random Fi ......

Pre-Training Transformer Span-Based Extraction Relation更新时间 2024-01-08

深度可分离卷积

深度可分离卷积，使用了一些 trick 极大减少卷积所需参数量和计算量。理解深度可分离卷积若需要对 12×12×3 的输入使用卷积，获得 8×8×256 的输出，直接的卷积方法是使用 256 个 5×5×3 的卷积核（无 padding、步长为 1，下同）。此时卷积层的参数量为 19200，卷积 ......

卷积深度更新时间 2024-01-08

深度学习图像复原之去雨：常用数据集介绍

可能有帮助的链接：https://paperswithcode.com/task/single-image-deraining 合成数据集 Rain100H 出自 CVPR 2017 论文 Deep Joint Rain Detection and Removal from a Single Ima ......

深度图像常用数据更新时间 2024-01-08

CHAT GPT全称及其发展历程深度剖析

CHAT GPT全称为Conversational Generative Pre-trained Transformer，是一种由OpenAI开发的自然语言处理模型。该模型旨在生成流畅且连贯的对话回复，从而在聊天机器人应用中表现出卓越的性能。 CHAT GPT的发展起始于OpenAI提出的GPT架构 ......

全称深度历程 CHAT GPT更新时间 2024-01-08

动手学深度学习v2：数据操作+数据预处理

数据操作 import torch x=torch.arange(12) # x的output为 tensor([0,1,2,3,4,5,6,7,8,9,10,11]) # 可以通过张量的shape属性来访问张量的形状和张量中元素的总数 x.shape # output: torch.Size([1 ......

数据深度更新时间 2024-01-08

机器学习周刊03:如何学习深度学习？2024 年学习生成式 AI 路线图、如何构建高效的RAG系统、苹果腾讯最新论文、阿里DreaMoving

腾讯推出的 AppAgent，是一个多模态智能体，通过识别当前手机的界面和用户指令直接操作手机界面，能像真实用户一样操作手机！机器学习周刊：关注Python、机器学习、深度学习、大模型等硬核技术 1、如何学习深度学习？最近X上有推友重提这篇文章，是网友看过 Jeremy 教授的 fast.ai ......

路线图 DreaMoving 深度周刊路线更新时间 2024-01-08

制约国产深度学习框架发展的根本原因 —— AI芯片的无法自主生产或量产

秉着没事就胡言乱语的宗旨，这里在接着胡说八道一下。国外的深度学习框架如TensorFlow、pytorch、Jax打的如火如荼，按照以往惯例我们是不应该去做自主研发软件系统的，毕竟硬件不在掌握之下，搞出的软件质量又不如外国的好，但是随着中美贸易战的爆发这一切被改写。国外的商用硬件和软件都开始对我 ......

框架深度芯片根本国产更新时间 2024-01-08

PyTorch 的 BatchNorm 层

BatchNorm 层为了实现输入特征标准化，batch norm 层会维护一个全局均值 running_mean 和全局方差 running_var。网络 train() 时进行统计，eval() 时使用统计值。除此之外，可选 weight 权重和 bias 权重，这两个权重是会持续参与到网络 ......

BatchNorm PyTorch更新时间 2024-01-07

Pytorch深度学习入门

一、配环境创建环境在Anaconda中输入 conda create -n pytorch python=3.6 ......

深度 Pytorch更新时间 2024-01-07

共2000篇 :1/67页 首页上一页1234下一页尾页