transform

《White-Box Transformers via Sparse Rate Reduction》论文学习

一、Introduction 近年来，深度学习在处理大量高维多模态数据方面取得了巨大的实证成功。其中很大一部分成功归功于对数据分布的有效学习，然后将分布转化为简洁的结构化和紧凑的表示形式，这有助于许多下游任务（例如视觉、分类、识别和分割以及生成。为此，已提出和实践了许多模型和方法，每种方法都有其优点 ......

Transformers White-Box Reduction Sparse 论文更新时间 2023-09-12

谁将取代 transformer；PPT 开发者去世；ChatGPT 访问量连续三个月下降丨 RTE开发者日报 Vol.46

开发者朋友们大家好：这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE （Real Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家 ......

开发者 transformer 访问量三个 ChatGPT更新时间 2023-09-11

String Transformation

String Transformation You are given two strings s and t of equal length n. You can perform the following operation on the string s: Remove a suffix of ......

Transformation String更新时间 2023-09-10

Nougat：一种用于科学文档OCR的Transformer 模型

随着人工智能领域的不断进步，其子领域，包括自然语言处理，自然语言生成，计算机视觉等，由于其广泛的用例而迅速获得了大量的普及。光学字符识别(OCR)是计算机视觉中一个成熟且被广泛研究的领域。它有许多用途，如文档数字化、手写识别和场景文本识别。数学表达式的识别是OCR在学术研究中受到广泛关注的一个领域。 ......

Transformer 模型文档科学 Nougat更新时间 2023-09-08

听我说，Transformer它就是个支持向量机

前言 SVM is all you need，支持向量机永不过时。本文转载自机器之心仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指导班、基 ......

向量 Transformer 就是更新时间 2023-09-07

Spikformer: When Spiking Neural Network Meets Transformer

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Published as a conference paper at ICLR 2023（同大组工作） ABSTRACT 我们考虑了两种生物学合理的结构，脉冲神经网络（SNN）和自注意机制。前者为深度学习提供了一种节能且事件驱动的范式，而 ......

Transformer Spikformer Network Spiking Neural更新时间 2023-09-07

ViTPose+：迈向通用身体姿态估计的视觉Transformer基础模型

京东探索研究院联合悉尼大学在这方面做出了探索，提出了基于简单视觉transformer的姿态估计模型ViTPose和改进版本ViTPose+。ViTPose系列模型在MS COCO多个人体姿态估计数据集上达到了新的SOTA和帕累托前沿。 ......

Transformer 姿态模型视觉身体更新时间 2023-09-07

【论文阅读】CAT: Cross Attention in Vision Transformer

论文地址：[2106.05786] CAT: Cross Attention in Vision Transformer (arxiv.org) 项目地址：https://github.com/linhezheng19/CAT 一、Abstract 由于Transformer在NLP中得到了广泛的应 ......

Transformer Attention Vision 论文 Cross更新时间 2023-09-07

CMT:卷积与Transformers的高效结合

论文提出了一种基于卷积和VIT的混合网络，利用Transformers捕获远程依赖关系，利用cnn提取局部信息。构建了一系列模型cmt，它在准确性和效率方面有更好的权衡。 CMT:体系结构 CMT块由一个局部感知单元(LPU)、一个轻量级多头自注意模块(LMHSA)和一个反向残差前馈网络(IRFFN ......

卷积 Transformers CMT更新时间 2023-09-07

Swin-Transformer 源码学习与使用手册

拜读了VIT以及TNT以及Swin-Transformer 的论文，结合B站up主的分析，预感Swin-Transformer具有ResNet似的跨里程碑式的意义，因此学习Swin-Transformer源码及其使用，记录如下。 Run Swin-Tpython -m torch.distrib ......

Swin-Transformer Transformer 源码手册 Swin更新时间 2023-09-06

ICML 2023 | 神经网络大还是小？Transformer模型规模对训练目标的影响

前言本文研究了 Transformer 类模型结构（configration）设计（即模型深度和宽度）与训练目标之间的关系。结论是：token 级的训练目标（如 masked token prediction）相对更适合扩展更深层的模型，而 sequence 级的训练目标（如语句分类）则相对不适合 ......

神经网络 Transformer 模型神经规模更新时间 2023-09-06

【ICML2022】Understanding The Robustness in Vision Transformers

来自NUS&NVIDIA 文章地址：[2204.12451] Understanding The Robustness in Vision Transformers (arxiv.org) 项目地址：https://github.com/NVlabs/FAN 一、Motivation CNN使用滑动 ......

Understanding Transformers Robustness Vision ICML更新时间 2023-09-06

Proj CDeepFuzz Paper Reading: Invariance-inducing regularization using worst-case transformations suffices to boost accuracy and spatial robustness

## Abstract 本文： Task: 1. prove invariance-inducing regularizers can increase predictive accuracy for worst-case spatial transformations 2. prove that ......

Invariance-inducing transformations regularization Invariance robustness更新时间 2023-09-05

Continuous-Time Sequential Recommendation with Temporal Graph Collaborative Transformer

[TOC] > [Fan Z., Liu Z., Zhang J., Xiong Y., Zheng L. and Yu P. S. Continuous-time sequential recommendation with temporal graph collaborative transfo ......

Continuous-Time Recommendation Collaborative Transformer Continuous更新时间 2023-09-05

transformer解读-更新中

Transformer是一种基于注意力机制的深度学习架构，专门用于处理序列数据，尤其在自然语言处理领域取得了重大突破。它由Google于2017年首次提出，并在各种NLP任务中表现出色，如机器翻译、文本生成和情感分析。主要特点包括：自注意力机制：Transformer的核心是自注意力（Self- ......

transformer更新时间 2023-08-31

NLP原理系列1-说清楚transformer原理

NLP原理系列1-说清楚transformer原理来用思维导图和截图描述。思维导图的本质是变化(解决问题)-> 更好的，或者复杂问题拆分为小问题以及拆分的思路。参考链接：李宏毅 transformer原理。一 tansformer的推理及训练过程 1 tf 训练过程红框部分是训练得 ......

原理 transformer NLP更新时间 2023-08-30

Transformer速查宝典：模型、架构、训练方法的论文都在这里了

前言论文大合集，一篇文章就搞定。本文转载自机器之心仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指导班、基础入门班、论文指导班全面上线! ......

Transformer 架构宝典模型方法更新时间 2023-08-28

带你上手基于Pytorch和Transformers的中文NLP训练框架

基于pytorch、transformers做中文领域的nlp开箱即用的训练框架，提供全套的训练、微调模型（包括大模型、文本转向量、文本生成、多模态等模型）的解决方案。 ......

Transformers 框架 Pytorch NLP更新时间 2023-08-28

聊聊HuggingFace Transformer

## 概述参见：[聊聊HuggingFace](https://www.cnblogs.com/zhiyong-ITNote/p/17640835.html) ## 项目组件一个完整的transformer模型主要包含三部分：Config、Tokenizer、Model。 ### Config ......

HuggingFace Transformer更新时间 2023-08-27

GPT之路(四) 神经网络架构Transformer工作原理

原文：What Are Transformer Models and How Do They Work? Transformer模型是机器学习中最令人兴奋的新发展之一。它们在论文Attention is All You Need中被介绍。Transformer可以用于写故事、文章、诗歌，回答问题，翻 ......

神经网络 Transformer 架构神经原理更新时间 2023-08-26

swin transformer

摘要核心1.本文提出一种可以适用于多种任务的backbone->swin transformer2.Transformer迁移到CV中有两点挑战->物体尺度不一，图像分辨率大3.为了解决尺度不一的问题，Swin Transformer使用了分层的结构(Pyramid)4.为了能够在高分辨率上运行，S ......

transformer swin更新时间 2023-08-26

使用 AutoGPTQ 和 transformers 让大语言模型更轻量化

大语言模型在理解和生成人类水平的文字方面所展现出的非凡能力，正在许多领域带来应用上的革新。然而，在消费级硬件上训练和部署大语言模型的需求也变得越来越难以满足。 🤗 Hugging Face 的核心使命是 _让优秀的机器学习普惠化_ ，而这正包括了尽可能地让所有人都能够使用上大模型。本着 [与 bi ......

transformers AutoGPTQ 模型语言更新时间 2023-08-25

transformer模型首次体验代码

首先是安装python，更新pip源到清华源。安装transformer pip install transformer 安装jupyter lab，也简单一行 pip install jupyterlab 现在不想用anaconda了，因为国内没有源了，国外的又慢。直接用pip吧。然后开始体验之 ......

transformer 模型代码更新时间 2023-08-24

使用 Transformers 优化文本转语音模型 Bark

🤗 Transformers 提供了许多最新最先进 (state-of-the-art, SoTA) 的模型，这些模型横跨多个领域及任务。为了使这些模型能以最佳性能运行，我们需要优化其推理速度及内存使用。 🤗 Hugging Face 生态系统为满足上述需求提供了现成且易于使用的优化工具，这些工 ......

Transformers 语音模型文本 Bark更新时间 2023-08-23

Transformer计算公式

## LLM inference workflow **Generative Inference**. A typical LLM generative inference task consists of two stages: i) the prefill stage which takes a ......

Transformer 公式更新时间 2023-08-23

bert，Bidirectional Encoder Representation from Transformers

BERT的全称是Bidirectional Encoder Representation from Transformers，是Google2018年提出的预训练模型，即双向Transformer的Encoder，因为decoder是不能获要预测的信息的。模型的主要创新点都在pre-train方法上 ......

Representation Bidirectional Transformers Encoder bert更新时间 2023-08-23

transformer

masked mutil-head attetion mask 表示掩码，它对某些值进行掩盖，使其在参数更新时不产生效果。Transformer 模型里面涉及两种 mask，分别是 padding mask 和 sequence mask。其中，padding mask 在所有的 scaled do ......

transformer更新时间 2023-08-23

Transformer历史揭秘及Transformer-DETR

Transformer历史揭秘及Transformer-DETR 揭秘创始八子：聚是一团火，散是满天星 Transformer创始八子深度揭秘：陈旧的身躯留不住年轻的心。谁曾想过，引发人工智能革命的突破竟源自一个改进机器翻译的想法？智东西8月21日消息，据英国《金融时报》报道，被称为“ChatG ......

Transformer Transformer-DETR 历史 DETR更新时间 2023-08-22

transformer模型的历史

Transformer 模型在深度学习领域，尤其是自然语言处理（NLP）中，起到了革命性的作用。以下是其发展历程的简要概述： 1. **背景**： - 在 Transformer 出现之前，循环神经网络（RNN）及其更先进的版本，如长短时记忆网络（LSTM）和门控循环单元（GRU）是处理序列任务的主 ......

transformer 模型历史更新时间 2023-08-21

transformer小白入门

transformer库是huggingface发布的1个框架，非常好用，很多外行看起来高大上的问题，用它都可以轻松解决，先来看1个小例子：一、情感分析 from transformers import pipeline classifier = pipeline('sentiment-analy ......

transformer更新时间 2023-08-20

共388篇 :6/13页 首页上一页3456789下一页尾页