transformer rethinking improving encoding

可视化学习：CSS transform与仿射变换

在几年前，我就在一些博客中看到关于CSS中transform的分析，讲到它与线性代数中矩阵的关系，但当时由于使用transform比较少，再加上我毕竟是个数学学渣，对数学有点畏难心理，就有点看不下去，所以只是随便扫了两眼，就没有再继续了解了。现在在学习可视化，又遇到了这个点，又说到这是可视化的基础知... ......

仿射 transform CSS更新时间 2023-12-21

transformer总体架构

transformer总体架构目录transformer总体架构循环神经网络总体架构EncoderDecoder输入输出层模型输入位置编码模型输出自注意力机制关于QKV的理解Q, K, V 及注意力计算多头注意力机制多头注意力机制作用Feed Forward 层参考资料论文地址：Attentio ......

transformer 架构总体更新时间 2023-12-20

transformer补充细节

transformer补充细节目录transformer补充细节注意力机制细节为什么对点积注意力进行缩放多头带来的好处数据流训练时数据流推理时数据流解码器中注意力的不同带掩码的注意力机制位置编码整型数值标记[0,1]范围标记位置二进制标记周期函数标识用sin和cos交替来表示位置训练测试细节参考资 ......

transformer 细节更新时间 2023-12-20

Sw-YoloX An anchor-free detector based transformer for sea surface object detection

Sw-YoloX An anchor-free detector based transformer for sea surface object detection 基于Transformer用于海上目标检测的无锚检测器：Sw-YoloX 1)由于不同海洋状态下的活体和漂浮物体数据稀缺且昂贵，我们 ......

anchor-free transformer detection Sw-YoloX detector更新时间 2023-12-19

SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation

SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation * Authors: [[Meng-Hao Guo]], [[Cheng-Ze Lu]], [[Qibin Hou]], [[Zhengning ......

Convolutional Segmentation Rethinking Attention Semantic更新时间 2023-12-18

Vision Transformer with Super Token Sampling

Vision Transformer with Super Token Sampling * Authors: [[Huaibo Huang]], [[Xiaoqiang Zhou]], [[Jie Cao]], [[Ran He]], [[Tieniu Tan]] Local library 初读 ......

Transformer Sampling Vision Super Token更新时间 2023-12-18

Bottleneck Transformers for Visual Recognition

Bottleneck Transformers for Visual Recognition * Authors: [[Aravind Srinivas]], [[Tsung-Yi Lin]], [[Niki Parmar]], [[Jonathon Shlens]], [[Pieter Abbee ......

Transformers Recognition Bottleneck Visual for更新时间 2023-12-18

SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation

SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation * Authors: [[Qiang Wan]], [[Zilong Huang]], [[Jiachen Lu]], [[Gang Yu]] ......

Squeeze-enhanced Segmentation Transformer SeaFormer Semantic更新时间 2023-12-18

UNetFormer: A UNet-like transformer for efficient semantic segmentation of remote sensing urban scene imagery

UNetFormer: A UNet-like transformer for efficient semantic segmentation of remote sensing urban scene imagery * Authors: [[Libo Wang]], [[Rui Li]], [[ ......

segmentation transformer UNetFormer UNet-like efficient更新时间 2023-12-18

SegViT: Semantic Segmentation with Plain Vision Transformers

SegViT: Semantic Segmentation with Plain Vision Transformers * Authors: [[Bowen Zhang]], [[Zhi Tian]], [[Quan Tang]], [[Xiangxiang Chu]], [[Xiaolin We ......

Segmentation Transformers Semantic SegViT Vision更新时间 2023-12-18

BiFormer: Vision Transformer with Bi-Level Routing Attention 使用超标记的轻量ViT

alias: Zhu2023a tags: 超标记注意力 rating: ⭐ share: false ptype: article BiFormer: Vision Transformer with Bi-Level Routing Attention * Authors: [[Lei Zhu] ......

轻量 Transformer 标记 Attention BiFormer更新时间 2023-12-18

2021-CVPR-Transformer Tracking

Transformer Tracking 相关性在跟踪领域起着关键作用，特别是在最近流行的暹罗跟踪器中。相关操作是考虑模板与搜索区域之间相似性的一种简单的融合方式。然而，相关操作本身是一个局部线性匹配过程，导致语义信息的丢失并容易陷入局部最优，这可能是设计高精度跟踪算法的瓶颈。还有比相关性更好的特征 ......

CVPR-Transformer Transformer Tracking 2021 CVPR更新时间 2023-12-18

Rethinking and Improving Relative Position Encoding for Vision Transformer: ViT中的位置编码

Rethinking and Improving Relative Position Encoding for Vision Transformer * Authors: [[Kan Wu]], [[Houwen Peng]], [[Minghao Chen]], [[Jianlong Fu]], ......

Transformer Rethinking Improving Encoding Relative更新时间 2023-12-18

Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition：使用大核卷积调制来简化注意力

Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition * Authors: [[Qibin Hou]], [[Cheng-Ze Lu]], [[Ming-Ming Cheng]], [[Jiashi Feng]] ......

卷积 Transformer-Style Conv2Former Recognition Transformer更新时间 2023-12-17

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows详解

初读印象 comment:: (Swin-transformer)代码：https://github. com/microsoft/Swin-Transformer 动机将在nlp上主流的Transformer转换到cv上。存在以下困难： nlp中单词标记是一个基本单元，但是视觉元素在尺度上有很大 ......

Transformer Hierarchical Shifted Windows Vision更新时间 2023-12-17

Segmentation Transformer: Object-Contextual Representations for Semantic Segmentation；OCRNet

Segmentation Transformer: Object-Contextual Representations for Semantic Segmentation * Authors: [[Yuhui Yuan]], [[Xiaokang Chen]], [[Xilin Chen]], [[ ......

Segmentation Object-Contextual Representations Transformer Contextual更新时间 2023-12-17

从滑动窗口到YOLO、Transformer：目标检测的技术革新

本文全面回顾了目标检测技术的演进历程，从早期的滑动窗口和特征提取方法到深度学习的兴起，再到YOLO系列和Transformer的创新应用。通过对各阶段技术的深入分析，展现了计算机视觉领域的发展趋势和未来潜力。关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验 ......

Transformer 目标技术 YOLO更新时间 2023-12-17

Instruction-Following Agents with Multimodal Transformer

概述提出了InstructRL，包含一个multimodal transformer用来将视觉obs和语言的instruction进行编码，以及一个transformer-based policy，可以基于编码的表示来输出actions。前者在1M的image-text对和NL的text上进行训 ......

Instruction-Following Instruction Transformer Multimodal Following更新时间 2023-12-16

电脑时间不同步导致的上网报错：core/proxy/vmess/encoding: failed to read response header > websocket: close 1006 (abnormal closure): unexpected EOF

报错内容： 2023/12/16 14:08:56 [Warning] [775541588] xxxxx.com/core/app/proxyman/outbound: failed to process outbound traffic > xxxxx.com/core/proxy/vmess/ ......

unexpected websocket abnormal encoding response更新时间 2023-12-16

共539篇 :2/18页 首页上一页12345下一页尾页

526互联

transformer rethinking improving encoding

可视化学习：CSS transform与仿射变换

transformer总体架构

transformer补充细节

Sw-YoloX An anchor-free detector based transformer for sea surface object detection

SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation

Vision Transformer with Super Token Sampling

Bottleneck Transformers for Visual Recognition

SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation

UNetFormer: A UNet-like transformer for efficient semantic segmentation of remote sensing urban scene imagery

SegViT: Semantic Segmentation with Plain Vision Transformers

BiFormer: Vision Transformer with Bi-Level Routing Attention 使用超标记的轻量ViT

2021-CVPR-Transformer Tracking

Rethinking and Improving Relative Position Encoding for Vision Transformer: ViT中的位置编码

Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition：使用大核卷积调制来简化注意力

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows详解

Segmentation Transformer: Object-Contextual Representations for Semantic Segmentation；OCRNet

从滑动窗口到YOLO、Transformer：目标检测的技术革新

Instruction-Following Agents with Multimodal Transformer

电脑时间不同步导致的上网报错：core/proxy/vmess/encoding: failed to read response header > websocket: close 1006 (abnormal closure): unexpected EOF

关于UIView transform使用注意点

将Transformer用于扩散模型，AI 生成视频达到照片级真实感

纯卷积BEV模型的巅峰战力 | BEVENet不用Transformer一样成就ADAS的量产未来(转)

【异常】File encoding has not been set, using platform encoding UTF-8, i.e. build is platform dependent!

【学习笔记】transformer 简札

Swin Transformer 马尔奖论文（ICCV 2021最佳论文）

jenkins修改file.encoding为UTF-8的终极方法

MIT斯坦福Transformer最新研究：过度训练让中度模型「涌现」结构泛化能力

CodeForces 1508F Optimal Encoding

transformer模型

【论文阅读笔记】【OCR-文本识别】 SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition