transformers revisiting attention spatial

【略读论文|时序知识图谱补全】Tucker Decomposition with Frequency Attention for Temporal Knowledge Graph Completion

会议：ACL，时间：2023，学校：北京航空航天大学，多伦多大学关键词：基于张量分解；频率注意力；正则化摘要：之前基于张量分解的TKGC模型存在仅独立考虑一种关系与一个时间戳的组合，忽略了嵌入的全局性质的问题。本文的方法：一种频率注意力（FA）模型来捕获一个关系与整个时间戳之间的全局时间依赖 ......

时序图谱 Decomposition Completion Attention更新时间 2023-11-27

nn.transformer

torch上给的案例 transformer_model = nn.Transformer(nhead=16, num_encoder_layers=12) # 创建一个具有16个注意力头和12个编码器层的Transformer模型 src = torch.rand((10, 32, 512))# ......

transformer nn更新时间 2023-11-26

[Codeforces] CF1506C Epic Transformation

Epic Transformation - 洛谷算是今天的题目里边思维难度最高的一道了，但是代码真的简单的要死题意你有一个长度为 \(n\) 的序列 \(a\)，你可以对其进行下列操作：选择 \(i,j\) 满足 \(*a_i\neq a_j*\) 然后删除 \(*a_i,a_j*\) 两个 ......

Transformation Codeforces 1506C 1506 Epic更新时间 2023-11-24

呼吸灯的实现用transform和animation实现

实现前端呼吸灯效果，录音效果效果图如下： <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name= ......

transform animation更新时间 2023-11-24

【论文阅读笔记】【OCR-End2End】 ESTextSpotter: Towards Better Scene Text Spotting with Explicit Synergy in Transformer

ESTextSpotter ICCV 2023 读论文思考的问题论文试图解决什么问题？场景文本端到端识别任务中，检测和识别两个任务的协同作用十分关键，然而以往的方法通常用一些十分隐式的方式来体现这种协同作用（shared backbone, shared encoder, shared quer ......

ESTextSpotter Transformer End Explicit Spotting更新时间 2023-11-23

打败VIT？Swin Transformer是怎么做到的

https://mp.weixin.qq.com/s/C5ZDYKPdHazR2bR9I9KFjQ 在之前的文章中，我们介绍过VIT（Vision Transformer），它将NLP中常用的Transformer架构用于图像分类的预训练任务上，取得了比肩ResNet的效果，成功证明了Transf ......

Transformer Swin VIT更新时间 2023-11-23

Convolutional Neural Networks on Graphs with Chebyshev Approximation, Revisited

目录概符号说明MotivationChebNetII代码 He M., Wei Z. and Wen J. Convolutional neural networks on graphs with chebyshev approximation, revisited. NIPS, 2022. 概作 ......

Convolutional Approximation Chebyshev Revisited Networks更新时间 2023-11-23

CF1506C Epic Transformation

CF1506C Epic Transformation Epic Transformation - 洛谷算是今天的题目里边思维难度最高的一道了，但是代码真的简单的要死题意你有一个长度为 \(n\) 的序列 \(a\)，你可以对其进行下列操作：选择 \(i,j\) 满足 \(*a_i\neq ......

Transformation 1506C 1506 Epic CF更新时间 2023-11-22

记录--居中为什么要使用 transform？

这里给大家分享我在网上总结出来的一些知识，希望对大家有所帮助引言居中是我们在前端布局中经常会遇到的问题，其中包括水平居中和垂直居中。居中的方法很多，比如说水平居中可以使用text-align: center或者margin: 0 auto等等来实现，垂直居中则需要使用一些其它的特殊的技巧。比如说 ......

transform更新时间 2023-11-22

论文阅读笔记：Revisiting Prototypical Network for Cross Domain Few-Shot Learning

标题：重新审视用于跨领域少样本学习的原型网络研究背景：问题背景：原型网络是一种流行的小样本学习方法，其网络简单而直观，对于小样本学习问题有着较好的表现，尤其是在图像分类等领域。存在问题：然而，当推广到跨领域的少样本分类任务时，其性能出现了大幅度下降，这严重限制了原型网络的实用性。研究动机： ......

Prototypical Revisiting Few-Shot Learning Network更新时间 2023-11-22

无依赖安装sentence-transformers

安装 pip install --no-cache-dir torch==1.8.0+cpu -f https://download.pytorch.org/whl/torch_stable.html pip install transformers tqdm numpy scikit-learn ......

sentence-transformers transformers sentence更新时间 2023-11-22

【略读论文|时序知识图谱补全】DREAM: Adaptive Reinforcement Learning based on Attention Mechanism for Temporal Knowledge Graph Reasoning

会议：SIGIR，时间：2023，学校：苏州大学计算机科学与技术学院，澳大利亚昆士兰布里斯班大学信息技术与电气工程学院，Griffith大学金海岸信息通信技术学院摘要：原因：现在的时序知识图谱推理方法无法生成显式推理路径，缺乏可解释性。方法迁移：由于强化学习 (RL) 用于传统知识图谱上的多跳 ......

时序图谱 Reinforcement Attention Knowledge更新时间 2023-11-21

How Attentive are Graph Attention Networks?

目录概符号说明GATv2代码 Brody S., Alon U. and Yahav E. How attentive are graph attention networks? ICLR, 2022. 概作者发现了 GAT 的 attention 并不能够抓住边的重要性, 于是提出了 GATv2 ......

Attentive Attention Networks Graph How更新时间 2023-11-19

自然语言处理预训练—— 来自Transformers的双向编码器表示（BERT）

我们已经介绍了几种用于自然语言理解的词嵌入模型。在预训练之后，输出可以被认为是一个矩阵，其中每一行都是一个表示预定义词表中词的向量。事实上，这些词嵌入模型都是与上下文无关的。让我们先来说明这个性质。从上下文无关到上下文敏感 ELMo（Embeddings from Language Models） ......

自然语言编码器双向 Transformers 编码更新时间 2023-11-18

关于TRANSFORM_TEX的一些问题

这个函数是用来控制shader面板中的tilling和offset的，本质为 uv * _MainTex_ST.xy + _MainTex_ST.zw; 但是使用TRANSFORM_TEX时需要注意的是，函数内部似乎没有封装完整，假如有类似于 TRANSFORM_TEX(uv + 20, _Main ......

TRANSFORM_TEX TRANSFORM 问题 TEX更新时间 2023-11-17

机器学习——Transformer

10.6.2节中比较了卷积神经网络（CNN）、循环神经网络（RNN）和自注意力（self-attention）。值得注意的是，自注意力同时具有并行计算和最短的最大路径长度这两个优势。因此，使用自注意力来设计深度架构是很有吸引力的。对比之前仍然依赖循环神经网络实现输入表示的自注意力模型 (Cheng ......

Transformer 机器更新时间 2023-11-16

最高加速9倍！字节跳动开源8比特混合精度Transformer引擎

前言近年来，Transformer 已经成为了 NLP 和 CV 等领域的主流模型，但庞大的模型参数限制了它的高效训练和推理。于是字节跳动在 2019 年 12 月和 2021 年 6 月分别推出了高效推理和训练引擎 LightSeq，大大加速了 Transformer 系列模型的训练和推理，也打 ......

字节精度 Transformer 引擎更新时间 2023-11-16

Cost Aggregation with Transformers for Sparse Correspondence-读书笔记

Cost Aggregation with Transformers for Sparse Correspondence:2022 背景: 该论文结合了SuperGlue和CATs，将里面所有手工制作的部分都代替了。将CATs引入该模型，用Transformer取代手工制作的成本聚合方法，用于具有自 ......

Correspondence Transformers Aggregation 笔记 Sparse更新时间 2023-11-13

Transformers 中原生支持的量化方案概述

本文旨在对 transformers 支持的各种量化方案及其优缺点作一个清晰的概述，以助于读者进行方案选择。目前，量化模型有两个主要的用途: 在较小的设备上进行大模型推理对量化模型进行适配器微调到目前为止，transformers 已经集成并原生支持了 bitsandbytes 和 aut ......

Transformers 方案更新时间 2023-11-13

TRL(Transformer Reinforcement Learning) PPO Trainer 学习笔记

(1) PPO Trainer TRL支持PPO Trainer通过RL训练语言模型上的任何奖励信号。奖励信号可以来自手工制作的规则、指标或使用奖励模型的偏好数据。要获得完整的示例，请查看examples/notebooks/gpt2-sentiment.ipynb。Trainer很大程度上受到了原 ......

Reinforcement Transformer Learning Trainer 笔记更新时间 2023-11-13

大语言模型里的Transformer还可以这么用？

前言自 LLM 诞生以来，我们见到了很多把 LLM 接到 Vision Backbone 后面的算法，那么有两个自然的问题：（1）LLM 的 Transformer 是否可以直接处理视觉 Token？（2）LLM 的 Transformer 是否可以提升处理视觉 Token 的 Performan ......

Transformer 模型语言更新时间 2023-11-12

《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》阅读笔记

论文标题《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》 Swin 这个词貌似来自后面的 Shifted Windows Shifted Windows：移动窗口 Hierarchical：分层作者 ......

Transformer Hierarchical Shifted Windows 笔记更新时间 2023-11-11

Self-Attention公式解释

Transformer的注意力机制被广泛应用于自然语言处理（NLP）领域中，它主要用于解决序列到序列的模型中长距离依赖问题。长距离依赖问题举个例子，考虑这个句子： “The cat, which was very hungry, finally found its food in the kit ......

Self-Attention 公式 Attention Self更新时间 2023-11-10

DeepMind指出「Transformer无法超出预训练数据实现泛化」，但有人投来质疑

前言难道 Transformer 注定无法解决「训练数据」之外的新问题？本文转载自机器之心仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指 ......

Transformer DeepMind 数据更新时间 2023-11-10

重新审视Transformer：倒置更有效，真实世界预测的新SOTA出现了

前言反转Transformer，变成iTransformer。本文转载自机器之心仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指导班、基础 ......

Transformer 世界 SOTA更新时间 2023-11-09

2023CVPR_Efficient Frequency Domain-based Transformers for High-Quality Image Deblurring

一. Motivation 1. Transformer在解决全局表现很好，但是复杂度很高，主要体现在QK的乘积: (We note that the scaled dot-product attention computation is actually to estimate the corre ......

CVPR_Efficient Domain-based Transformers High-Quality Deblurring更新时间 2023-11-07

2023CVPR_Spatial-Frequency Mutual Learning for Face Super-Resolution

一. Network：SFMNet 1.网络采用U-Net结构，其中SFMLM-i是不同分辨率的每层结构 2.SPB是空域分支，FRB是频域分支，分别经过FRB和SPB的两个分支信息经过FSIB分支进行信息的融合 3. FRB结构： class FreBlock9(nn.Module): def _ ......

CVPR_Spatial-Frequency Super-Resolution Resolution Frequency Learning更新时间 2023-11-06

2023-8-24 Pyramid Vision Transformer 2023人工智能大会青年科学家论坛

人工智能 2023 Transformer 科学家人工更新时间 2023-11-06

《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》阅读笔记

论文标题《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》谷歌论文起名越来越写意了，“一幅图像值16X16个单词” 是什么玩意儿。 AT SCALE：说明适合大规模的图片识别，也许小规模的不好使 ......

IMAGE TRANSFORMERS RECOGNITION 笔记 16X16更新时间 2023-11-05

聊聊Transform模型

摘自《BERT基础教程：Transformer大模型实战》概述循环神经网络和长短期记忆网络已经广泛应用于时序任务，比如文本预测、机器翻译、文章生成等。然而，它们面临的一大问题就是如何记录长期依赖。为了解决这个问题，一个名为Transformer的新架构应运而生。从那以后，Transforme ......

Transform 模型更新时间 2023-11-04

共500篇 :4/17页 首页上一页1234567下一页尾页