anchor-free transformer detection sw-yolox
无依赖安装sentence-transformers
安装 pip install --no-cache-dir torch==1.8.0+cpu -f https://download.pytorch.org/whl/torch_stable.html pip install transformers tqdm numpy scikit-learn ......
自然语言处理预训练—— 来自Transformers的双向编码器表示(BERT)
我们已经介绍了几种用于自然语言理解的词嵌入模型。在预训练之后,输出可以被认为是一个矩阵,其中每一行都是一个表示预定义词表中词的向量。事实上,这些词嵌入模型都是与上下文无关的。让我们先来说明这个性质。 从上下文无关到上下文敏感 ELMo(Embeddings from Language Models) ......
关于TRANSFORM_TEX的一些问题
这个函数是用来控制shader面板中的tilling和offset的,本质为 uv * _MainTex_ST.xy + _MainTex_ST.zw; 但是使用TRANSFORM_TEX时需要注意的是,函数内部似乎没有封装完整,假如有类似于 TRANSFORM_TEX(uv + 20, _Main ......
机器学习——Transformer
10.6.2节中比较了卷积神经网络(CNN)、循环神经网络(RNN)和自注意力(self-attention)。值得注意的是,自注意力同时具有并行计算和最短的最大路径长度这两个优势。因此,使用自注意力来设计深度架构是很有吸引力的。对比之前仍然依赖循环神经网络实现输入表示的自注意力模型 (Cheng ......
最高加速9倍!字节跳动开源8比特混合精度Transformer引擎
前言 近年来,Transformer 已经成为了 NLP 和 CV 等领域的主流模型,但庞大的模型参数限制了它的高效训练和推理。于是字节跳动在 2019 年 12 月和 2021 年 6 月分别推出了高效推理和训练引擎 LightSeq,大大加速了 Transformer 系列模型的训练和推理,也打 ......
论文精读:用于少样本目标检测的元调整损失函数和数据增强(Meta-tuning Loss Functions and Data Augmentation for Few-shot Object Detection)
论文链接:Meta-Tuning Loss Functions and Data Augmentation for Few-Shot Object Detection Abstract 现阶段的少样本学习技术可以分为两类:基于微调(fine-tuning)方法和基于元学习(meta-learning ......
Cost Aggregation with Transformers for Sparse Correspondence-读书笔记
Cost Aggregation with Transformers for Sparse Correspondence:2022 背景: 该论文结合了SuperGlue和CATs,将里面所有手工制作的部分都代替了。将CATs引入该模型,用Transformer取代手工制作的成本聚合方法,用于具有自 ......
Transformers 中原生支持的量化方案概述
本文旨在对 transformers 支持的各种量化方案及其优缺点作一个清晰的概述,以助于读者进行方案选择。 目前,量化模型有两个主要的用途: 在较小的设备上进行大模型推理 对量化模型进行适配器微调 到目前为止,transformers 已经集成并 原生 支持了 bitsandbytes 和 aut ......
TRL(Transformer Reinforcement Learning) PPO Trainer 学习笔记
(1) PPO Trainer TRL支持PPO Trainer通过RL训练语言模型上的任何奖励信号。奖励信号可以来自手工制作的规则、指标或使用奖励模型的偏好数据。要获得完整的示例,请查看examples/notebooks/gpt2-sentiment.ipynb。Trainer很大程度上受到了原 ......
大语言模型里的Transformer还可以这么用?
前言 自 LLM 诞生以来,我们见到了很多把 LLM 接到 Vision Backbone 后面的算法,那么有两个自然的问题:(1)LLM 的 Transformer 是否可以直接处理视觉 Token?(2)LLM 的 Transformer 是否可以提升处理视觉 Token 的 Performan ......
《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》阅读笔记
论文标题 《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》 Swin 这个词貌似来自后面的 Shifted Windows Shifted Windows:移动窗口 Hierarchical:分层 作者 ......
DeepMind指出「Transformer无法超出预训练数据实现泛化」,但有人投来质疑
前言 难道 Transformer 注定无法解决「训练数据」之外的新问题? 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指南】CV全栈指 ......
重新审视Transformer:倒置更有效,真实世界预测的新SOTA出现了
前言 反转Transformer,变成iTransformer。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指南】CV全栈指导班、基础 ......
No compiler detected, make sure you are running on top of a JDK instead of a JRE
Java 调 webservice 报如下错误 [2023-11-07 17:01:02.315] ERROR [scheduling-1] ToHisApiImpl.java:106 - No compiler detected, make sure you are running on top ......
2023CVPR_Efficient Frequency Domain-based Transformers for High-Quality Image Deblurring
一. Motivation 1. Transformer在解决全局表现很好,但是复杂度很高,主要体现在QK的乘积: (We note that the scaled dot-product attention computation is actually to estimate the corre ......
【论文阅读笔记】【OCR-文本检测】 Few Could Be Better Than All: Feature Sampling and Grouping for Scene Text Detection
CVPR 2022 读论文思考的问题 论文试图解决什么问题? 一些基于 DETR 的方法在 ICDAR15, MLT17 等文字尺度变化范围较大的数据集上文本检测的效果不佳 DETR 运用的高层特征图难以捕捉小文字的特征,且会引入很多无关的背景噪声,增加了检测的困难程度 即使使用 DETR 的改进模 ......
2023-8-24 Pyramid Vision Transformer 2023人工智能大会青年科学家论坛
Pyramid Vision Transformer | 2023人工智能大会青年科学家论坛 王文海 香港中文大学 首次将多层次金字塔结构引入视觉变化网络 研究动机 | 方法 | 感受野,模型权重->表征能力 | 结构输出->适用面 | | | | | | CNN | 局部固定 | 金字塔多尺度 | ......
存在检测(Presence detection)技术介绍
存在检测技术是一种用于检测某个实体是否存在于某个特定区域的技术。在不同的领域和应用中、存在检测技术有着不同的表现形式和技术实现方法。本文将概述目前存在检测技术存在的问题,并比较几种常见的存在检测技术的优缺点。 1 存在检测技术介绍 无处不在的传感技术(例如FMCW雷达)的发展促进了占用传感器的发展, ......
几种常见的运动检测(Motion detection)方法
本文选自《Multiple methods for motion detection》,原文参考文末链接。 运动检测有许多不同的方案,但哪一个最适合您的需求?在这里,我将介绍一些使用最广泛的运动传感器技术,并探讨每种技术都可以发挥其优势的情况。 https://mp.weixin.qq.com/s/ ......
《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》阅读笔记
论文标题 《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》 谷歌论文起名越来越写意了,“一幅图像值16X16个单词” 是什么玩意儿。 AT SCALE:说明适合大规模的图片识别,也许小规模的不好使 ......
聊聊Transform模型
摘自《BERT基础教程:Transformer大模型实战 》 概述 循环神经网络和长短期记忆网络已经广泛应用于时序任务,比如文本预测、机器翻译、文章生成等。然而,它们面临的一大问题就是如何记录长期依赖。 为了解决这个问题,一个名为Transformer的新架构应运而生。从那以后,Transforme ......
[论文阅读] Mean-Shifted Contrastive Loss for Anomaly Detection
Mean-Shifted Contrastive Loss for Anomaly Detection Abstract 这篇文章探讨了异常检测领域的一个关键问题,即如何通过使用预训练特征来提高异常检测性能。研究者首先介绍了异常检测的背景和现有方法,指出了使用自监督学习和外部数据集预训练特征的潜力。 ......
Literature Survey about Volumetric Grasping Network: Real-time 6 DOF Grasp Detection in Clutter
This is a literature survey about the paper of Volumetric Grasping Network: Real-time 6 DOF Grasp Detection in Clutter. ......
【纯 Transformer 也可以取代 CNN 用于CV】Vision Transformer (ViT) 论文精读
原始题目 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale 中文名称 一张图像等价于 16x16 Words: Transformers 来做大规模的图像识别 发表时间 2020年10月22日 平台 ......
Swin-transformer论文阅读笔记(Swin Transformer: Hierarchical Vision Transformer using Shifted Windows)
论文标题:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 论文作者:Ze Liu, Yutong Lin, Yue Cao, Han Hu, Yixuan Wei, Zheng Zhang, Stephe ......
比Transformer更好,无Attention、MLPs的BERT、GPT反而更强了
前言 本文探索了 Monarch Mixer (M2) ,这是一种在序列长度和模型维度上都是次二次的新架构,并且在现代加速器上具有很高的硬件效率。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 ......
【CVPR2023】Learning A Sparse Transformer Network for Effective Image Deraining
论文:https://readpaper.com/paper/4736105248993591297 代码:https://github.com/cschenxiang/DRSformer Transformer 模型通常使用标准的 QKV 三件套进行计算,但是部分来自 K 的 token 与来自 ......
【CNN 取代 Transformer 加速 SAM】Fast SAM 笔记
将 SAM 任务转换为经过广泛研究的实例分割任务,并仅使用 SAM 作者发布的SA-1B数据集的1/50进行训练现有的实例分割方法 问题 1: 本文要解决什么问题? SAM 的计算成本高,主要来自于 处理高分辨率输入的 Transformer 架构。本文想要加速 SAM 模型的推理速度。 问题 2: ......
【找到 Anchor-based and Anchor-free 性能差距的本质】Adaptive Training Sample Selection (ATSS) 论文精读
原始题目:Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection 中文翻译:通过 自适应训练样本选择 缩小 Anchor-based and Anch ......