understanding transformers robustness vision

CF1506D - Epic Transformation

思路用优先队列模拟 ac代码 #include <bits/stdc++.h> using namespace std; using i64 = long long; const i64 inf = 8e18; typedef pair<int, int> pii; const int N = 5 ......

Transformation 1506D 1506 Epic CF更新时间 2024-01-13

Understanding JSON Web Encryption (JWE)

copy from: https://www.scottbrady91.com/jose/json-web-encryption By default, JSON Web Tokens (JWTs) are base64url encoded JSON objects signed using a ......

Understanding Encryption JSON JWE Web更新时间 2024-01-12

LLM series: Transformer

🥥 Homepage Dataset, DataLoader, and Transforms Model Traning Model 🥑 Get Started! Import libraries: import torch import torch.nn as nn import torch. ......

Transformer series LLM更新时间 2024-01-12

Learning Dynamic Query Combinations for Transformer-based Object** Detection and Segmentation论文阅读笔记

Motivation & Intro 基于DETR的目标检测范式（语义分割的Maskformer也与之相似）通常会用到一系列固定的query，这些query是图像中目标对象位置和语义的全局先验。如果能够根据图像的语义信息调整query，就可以捕捉特定场景中物体位置和类别的分布。例如，当高级语义显示图 ......

Transformer-based Combinations Segmentation Transformer Detection更新时间 2024-01-11

[NLP复习笔记] Transformer

1. Transformer 概述 1.1 整体结构 \(\text{Transformer}\) 主要由 \(\text{Encoder}\) 和 \(\text{Decoder}\) 两个部分组成。\(\text{Encoder}\) 部分有 \(N = 6\) 个相同的层，每层包含一个 \( ......

Transformer 笔记 NLP更新时间 2024-01-11

Understanding the linux kernel Chapter2 Memory Addressing

Physical Memory Layout unavailable address for kernel either because they map hardware devices’ I/O shared memory or because the corresponding page fr ......

Understanding Addressing Chapter2 Chapter Memory更新时间 2024-01-11

神经网络优化篇：理解mini-batch梯度下降法（Understanding mini-batch gradient descent）

理解mini-batch梯度下降法使用batch梯度下降法时，每次迭代都需要历遍整个训练集，可以预期每次迭代成本都会下降，所以如果成本函数\(J\)是迭代次数的一个函数，它应该会随着每次迭代而减少，如果\(J\)在某次迭代中增加了，那肯定出了问题，也许的学习率太大。使用mini-batch梯度下 ......

mini-batch 神经网络梯度 batch mini更新时间 2024-01-11

RNN 和 Transformer 复杂度比较

这里假设BatchSize为 1，就是单样本的情况。原始 RNN 块：（1）单步计算 H，包含两个矩阵向量乘法，和一个激活，复杂度HidSize² （2）一共有SeqLen步，所以整体复杂度SeqLen * HidSize² LSTM 块：（1）单步计算 F I C_hat O，包含八个矩阵向 ......

复杂度 Transformer RNN更新时间 2024-01-09

挑战Transformer的新架构Mamba解析以及Pytorch复现

今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模” Mamba一直在人工智能界掀起波澜，被吹捧为Transformer的潜在竞争对手。到底是什么让Mamba在拥挤的序列建中脱颖而出? 在介绍之前先简要回顾一下现有的模型 Transformer:以其注意力机制而闻名，其中序 ......

Transformer 架构 Pytorch Mamba更新时间 2024-01-09

《Span-Based Joint Entity and Relation Extraction with Transformer Pre-Training》阅读笔记

代码原文地址预备知识： 1.什么是束搜索算法（beam search）? beam search是一种用于许多自然语言处理和语音识别模型的算法，作为最终决策层，用于在给定目标变量(如最大概率或下一个输出字符)的情况下选择最佳输出。 2.什么是条件随机场（Conditional Random Fi ......

Pre-Training Transformer Span-Based Extraction Relation更新时间 2024-01-08

Understanding q-value and FDR in Differential Expression Analysis

Understanding q-value and FDR in Differential Expression Analysis Daqian Introduction to q-value and FDR In differential gene expression analysis, res ......

Understanding Differential Expression Analysis q-value更新时间 2024-01-08

ICLR 2022: Anomaly Transformer论文阅读笔记+代码复现

本论文全名为Anomaly Transformer: Time Series Anomaly Detection with Association Descrepancy（通过关联差异进行时序异常检测），主要提出了一种无监督的异常点检测算法，并在6个benchmarks上测试，获取良好结果。论文链 ......

Transformer Anomaly 代码笔记论文更新时间 2024-01-05

概率霍夫变换（Progressive Probabilistic Hough Transform）原理详解

概率霍夫变换（Progressive Probabilistic Hough Transform）的原理很简单，如下所述： 1.随机获取边缘图像上的前景点，映射到极坐标系画曲线； 2.当极坐标系里面有交点达到最小投票数，将该点对应x-y坐标系的直线L找出来； 3.搜索边缘图像上前景点，在直线L上的点 ......

Probabilistic 概率 Progressive Transform 原理更新时间 2024-01-03

5、flink任务中可以使用哪些转换算子（Transformation）

5、flink任务中可以使用哪些转换算子（Transformation） <div id="content_views" class="htmledit_views"> <h1>1、什么是Flink中的转换算子</h1> 在使用 Flink DataStream API 开发流式计算任务时，可以将一 ......

算子 Transformation 任务 flink更新时间 2024-01-03

Understanding ELF, the Executable and Linkable Format

address:https://www.opensourceforu.com/2020/02/understanding-elf-the-executable-and-linkable-format/ Whenever we compile any code, the output that we ......

Understanding Executable Linkable Format ELF更新时间 2023-12-31

Visual Transformer 与归纳偏置

开端 ViT（Visual Transformer）是 2020 年 Google 团队提出的将 Transformer 应用在图像分类的模型，但是当训练数据集不够大的时候，ViT 的表现通常比同等大小的 ResNets 要差一些。为什么呢？寻找答案的过程中，发现了归纳偏置这个概念。在阅读 ......

Transformer Visual更新时间 2023-12-31

transformers 系列

Attention 注意力机制【1】-入门篇注意力机制【2】- CV中的注意力机制注意力机制【3】-Self Attention 注意力机制【4】-多头注意力机制注意力机制【5】Scaled Dot-Product Attention 和 mask attention 注意力机制【6】-tra ......

transformers更新时间 2023-12-30

Pandas - apply、agg、transform 函数

apply：行或列的操作。 agg：聚合，可以传递字典，对多个列使用不同的函数。最终结果可能会合并，与原 DataFrame 列长度不保持一致。 transform：转换，也可以对多个列使用不同的函数。但是最终结果与原 DataFrame 列长度保持一致，不会聚合。 ......

函数 transform Pandas apply agg更新时间 2023-12-30

VIT Vision Transformer

VIT Vision Transformer 目录VIT Vision TransformerViT模型结构图像划分PatchLinear Projection of Flatted PatchesPatch+Position Embedding分类向量和位置向量EncoderMLP Head（全连 ......

Transformer Vision VIT更新时间 2023-12-29

Swin Transformer

Swin Transformer 目录Swin Transformer简介VIT的缺陷核心创新总体结构和运作网络细节Patch partitionLinear EmbeddingPatch MergingSwin Block模块W-MSASW-MSAAttention Mask计算成本分析主要优势S ......

Transformer Swin更新时间 2023-12-29

DETR基于Transformer目标检测

DETR基于Transformer目标检测目录DETR基于Transformer目标检测DETR网络结构和NLP Transformer对比Object QueryFFN为什么DETR不需要NMS优缺点参考资料 DETR首次将Transformer应用到了目标检测任务中。图像会先经过一个传统的CN ......

Transformer 目标 DETR更新时间 2023-12-29

【Transformer 基础系列】手推显存占用

https://zhuanlan.zhihu.com/p/648924115 本文试图以最清晰的方式手动推导 Transformers 每一步的参数量到显存、计算量问题。理解底层，才能更好的做训练和优化。可能是目前最全的大模型显存优化方案分析。本文内容包括（1）模型训练和推理过程中的显存占用（2） ......

显存 Transformer 基础更新时间 2023-12-26

Unity3D 通过transform实现人物移动还是velocity详解

Unity3D是一款非常流行的游戏引擎，它提供了多种方式来实现游戏中的人物移动。其中，最常用的两种方法是通过transform组件和通过velocity属性来实现。对啦！这里有个游戏开发交流小组里面聚集了一帮热爱学习游戏的零基础小白，也有一些正在从事游戏开发的技术大佬，欢迎你来交流学习。通过tr ......

transform velocity Unity3D 人物还是更新时间 2023-12-26

神经网络优化篇：如何理解 dropout（Understanding Dropout）

理解 dropout Dropout可以随机删除网络中的神经单元，为什么可以通过正则化发挥如此大的作用呢？直观上理解：不要依赖于任何一个特征，因为该单元的输入可能随时被清除，因此该单元通过这种方式传播下去，并为单元的四个输入增加一点权重，通过传播所有权重，dropout将产生收缩权重的平方范数的效 ......

神经网络 Understanding 神经 dropout Dropout更新时间 2023-12-26

UNIQUE VISION Programming Contest 2023 Christmas (AtCoder Beginner Contest 334)

UNIQUE VISION Programming Contest 2023 Christmas (AtCoder Beginner Contest 334) A - Christmas Present 代码: #include <bits/stdc++.h> using namespace std ......

Contest Programming Christmas Beginner AtCoder更新时间 2023-12-26

GPT-1论文《Improving Language Understanding by Generative Pre-Training》解读

背景 GPT-1 采用了两阶段训练的方式： 1. 第一阶段 pre-training，在海量文本上训练，无需label，根据前k-1个词预测第k个单词是什么，第一阶段的训练让模型拥有了很多的先验知识，模型具有非常强的泛化性 2. 第二阶段在特定任务上fine-tuning，让模型能适应不同的任务，提 ......

Understanding Pre-Training Generative Improving Language更新时间 2023-12-25

kettle从入门到精通第二十六课再谈 kettle Transformation executor

1、前面文章有学习过Transformation executor ，但后来测试kettle性能的时候遇到了很大的问题，此步骤的处理性能太慢，导致内存溢出等问题。所以再次一起学习下此步骤的用法。 2、如下图中rds-sametable-同步逻辑处理使用的是Transformation execut ......

kettle Transformation executor更新时间 2023-12-25

transformer 预测 ENSO

第一篇《A self-attention–based neural network for threedimensional multivariate modeling and its skillful ENSO predictions 》发表在Sci Adv. 张荣华起名3D-Geoforme ......

transformer ENSO更新时间 2023-12-22

可视化学习：CSS transform与仿射变换

在几年前，我就在一些博客中看到关于CSS中transform的分析，讲到它与线性代数中矩阵的关系，但当时由于使用transform比较少，再加上我毕竟是个数学学渣，对数学有点畏难心理，就有点看不下去，所以只是随便扫了两眼，就没有再继续了解了。现在在学习可视化，又遇到了这个点，又说到这是可视化的基础知... ......

仿射 transform CSS更新时间 2023-12-21

Hierarchical Clustering-based Personalized Federated Learning for Robust and Fair Human Activity Recognition-2023

任务：人类活动识别任务Human Activity Recognition HAR 指标：系统准确性、公平性、鲁棒性、可扩展性方法：1. 提出一个带有层次聚类（针对鲁棒性和公平的HAR）个性化的FL框架FedCHAR；通过聚类（利用用户之间的内在相似关系）提高模型性能的准确性、公平性、鲁棒性。 2 ......

Clustering-based Hierarchical Personalized Recognition Clustering更新时间 2023-12-20

共500篇 :1/17页 首页上一页1234下一页尾页