CVPR
【五期杨志】CCF-A(CVPR'22) Dual-Key Multimodal Backdoors for Visual Question Answering
Walmer M, Sikka K, Sur I, et al. Dual-Key Multimodal Backdoors for Visual Question Answering[C]//Proceedings of the IEEE/CVF Conference on Computer Vi ......
2021-CVPR-Transformer Tracking
Transformer Tracking 相关性在跟踪领域起着关键作用,特别是在最近流行的暹罗跟踪器中。相关操作是考虑模板与搜索区域之间相似性的一种简单的融合方式。然而,相关操作本身是一个局部线性匹配过程,导致语义信息的丢失并容易陷入局部最优,这可能是设计高精度跟踪算法的瓶颈。还有比相关性更好的特征 ......
2020CVPR_High-Resolution Image Synthesis with Latent Diffusion Models
1.AutoEncoder AutoEncoder(自编码器)是一种无监督学习的神经网络模型,用于学习有效的数据表示。它的目标是将输入数据编码成一种潜在的、紧凑的表示形式,然后从这个表示中重构原始输入。自编码器由两部分组成:编码器(Encoder)和解码器(Decoder)。编码器(Encoder) ......
Class-Incremental Learning with Generative Classifiers(CVPR2021W)
前置知识:VAE(可以参考https://zhuanlan.zhihu.com/p/348498294) Motivation 之前的方法通常使用判别式分类器,对条件分布\(p(y|\textbf{x})\)进行建模(classifier+softmax+ce)。其问题在于分类器会偏向最新学的类别, ......
2023CVPR_Efficient Frequency Domain-based Transformers for High-Quality Image Deblurring
一. Motivation 1. Transformer在解决全局表现很好,但是复杂度很高,主要体现在QK的乘积: (We note that the scaled dot-product attention computation is actually to estimate the corre ......
2023CVPR_Spatial-Frequency Mutual Learning for Face Super-Resolution
一. Network:SFMNet 1.网络采用U-Net结构,其中SFMLM-i是不同分辨率的每层结构 2.SPB是空域分支,FRB是频域分支,分别经过FRB和SPB的两个分支信息经过FSIB分支进行信息的融合 3. FRB结构: class FreBlock9(nn.Module): def _ ......
【CVPR2023】Efficient and Explicit Modelling of Image Hierarchies for Image Restoration
> 论文:https://readpaper.com/paper/4728855966703960065 代码:https://github.com/ofsoundof/GRL-Image-Restoration 这个论文的代码地址叫GRL,意思是 Global, Regional, Local 的 ......
【CVPR2023】Learning A Sparse Transformer Network for Effective Image Deraining
论文:https://readpaper.com/paper/4736105248993591297 代码:https://github.com/cschenxiang/DRSformer Transformer 模型通常使用标准的 QKV 三件套进行计算,但是部分来自 K 的 token 与来自 ......
CVPR2023:SimpleNet:一个简单的图像异常检测和定位网络
论文题目: SimpleNet: A Simple Network for Image Anomaly Detection and Localization 摘要 我们提出了一个简单且应用友好的网络(称为SimpleNet)来检测和定位异常。SimpleNet由四个部分组成:(1)生成局部特征的预训 ......
【CVPR2022】Shunted Self-Attention via Multi-Scale Token Aggregation
来自CVPR2022 基于多尺度令牌聚合的分流自注意力 论文地址:[2111.15193] Shunted Self-Attention via Multi-Scale Token Aggregation (arxiv.org) 项目地址:https://github.com/OliverRensu ......
CVPR 2023 | TinyMIM:微软亚洲研究院用知识蒸馏改进小型ViT
前言 本文提出了 TinyMIM,它是第一个成功地使小模型受益于 MIM 预训练的模型。 本文转载自机器之心 作者:微软亚洲研究院 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全 ......
CVPR 2023 冠军解决方案,零样本异常分割新突破!
前言 本文介绍了CVPR2023 冠军解决方案,零样本异常分割新突破! 本文转载自我爱计算机视觉 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指南】CV全栈 ......
Unsupervised Learning of Depth and Ego-Motion from Video(CVPR2017)论文阅读
深度估计问题 从输入的单目或双目图像,计算图像物体与摄像头之间距离(输出距离图),双目的距离估计应该是比较成熟和完善,但往单目上考虑主要还是成本的问题,所以做好单目的深度估计有一定的意义。单目的意思是只有一个摄像头,同一个时间点只有一张图片。就象你闭上一只眼睛,只用一只眼睛看这个世界的事物一样,距离 ......
Lite-Mono(CVPR2023)论文解读
Lite-Mono: A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth Estimation 是CVPR2023收录的论文,从它的标题能很清晰了解到它所在的领域或解决的问题是:自监督的 ......
CVPR 2023 | RCF:完全无监督的视频物体分割
TLDR: 视频分割一直是重标注的一个task,这篇CVPR 2023文章研究了完全不需要标注的视频物体分割。仅使用ResNet,RCF模型在DAVIS16/STv2/FBMS59上提升了7/9/5%。文章里还提出了不需要标注的调参方法。代码已公开可用。 Paper title: Bootstrap ......
CVPR 2023 | 南洋理工、商汤提出E3DGE:2D图片秒出3D形象
前言 在CVPR 2023上,南洋理工大学-商汤科技联合实验室S-Lab的研究者提出的基于Encoder的快速3D GAN Inversion方法,针对现有3D GAN inversion方法无法兼顾重建速度、重建质量和编辑质量的问题,提出一种自监督3D GAN inversion训练框架。同时,通 ......
论文阅读: (CVPR2023 SDT )基于书写者风格和字符风格解耦的手写文字生成及源码对应
#### 引言 - 许久不认真看论文了,这不赶紧捡起来。这也是自己看的第一篇用到Transformer结构的CV论文。 - 之所以选择这篇文章来看,是考虑到之前做过手写字体生成的项目。这个工作可以用来合成一些手写体数据集,用来辅助手写体识别模型的训练。 - 本篇文章将从论文与代码一一对应解析的方式来 ......
CVPR23 | 浙大、NTU提出零样本通用分割框架PADing
前言 本文分享论文【Primitive Generation and Semantic-related Alignment for Universal Zero-Shot Segmentation】,由浙大、NTU提出零样本通用分割框架PADing。 本文转载自我爱计算机视觉 仅用于学术分享,若侵权 ......
CVPR'23|一张图重建3D人物新思路:完美复刻复杂动作和宽松衣物,遮挡也不在话下
前言 用一张人像直接打造3D数字人最大的挑战是什么?或许就是兼顾稳定性和自由度。 本文转载自量子位 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指南】CV全 ......
CVPR最佳论文颁给自动驾驶大模型!中国团队第一单位,近10年三大视觉顶会首例
前言 这个高光时刻,属于自动驾驶,属于大模型,更是属于中国团队。 本文转载自量子位 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指南】CV全栈指导班、基础入 ......
CVPR23 Highlight | 多模态新任务、新数据集:NTU提出广义引用分割问题GRES
前言 来自新加坡南洋理工大学的研究者们定义了一个名为广义引用分割(Generalized Referring Expression Segmentation,GRES)的新任务,将经典的引用分割扩展到允许表达式指代任意数量的目标对象。同时,文章还构建了第一个大规模的GRES数据集gRefCOCO,其 ......
CVPR 2023 | 会模仿笔迹的AI,为你创造专属字体
前言 来自华南理工大学、新加坡国立大学、香港理工大学以及琶洲实验室的研究者们联合提出一种有趣的手写文字生成方法,仅需提供少量的参考样本即可临摹用户的书写风格,进而生成符合该风格的任意文字。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、 ......
12篇CVPR 2023 最佳论文候选
前言 CVPR 2023 开幕在即,官方公布了12篇最佳论文候选,快来看看都是什么内容吧! 本文转载自我爱计算机视觉 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【C ......
2023CVPR_Low-Light Image Enhancement via Structure Modeling and Guidance(代码暂无公布)
大佬链接:CVPR2023 低光照图像增强论文阅读 基于结构先验的图像增强 - 知乎 (zhihu.com) 一 motivation 1. 现有低光照图像增强方法忽视了在低光照区域结构信息建模对增强的作用(ignore the explicit modeling of structural det ......
[CVPR23 Highlight] Side Adapter Network for Open-Vocabulary Semantic Segmentation论文阅读笔记
** ## 摘要 本文提出了一个用于开放词汇语义分割的新框架SAN,将语义分割任务建模为区域识别问题,提取mask proposals并使用CLIP对mask进行识别。SAN可以重新利用CLIP的特征,因此其本身可以非常轻量;同时网络可以端到端地进行训练,从而使SAN适应冻结的CLIP模型。本文方法 ......
2023CVPR_Learning a Simple Low-light Image Enhancer from Paired Low-light Instances(PairLLE)无监督
一. motivation 以前的大多数LIE算法使用单个输入图像和几个手工制作的先验来调整照明。然而,由于单幅图像信息有限,手工先验的适应性较差,这些解决方案往往无法揭示图像细节。 二. contribution 1. 提出一个成对低光图像输入(相同内容,不同的曝光度) 2. 在输入之前进行了一个 ......
CVPR 2023 | Collaborative Diffusion 怎样让不同的扩散模型合作?
前言 CVPR 2023有哪些亮点?Collaborative Diffusion提供了一种简单有效的方法来实现不同扩散模型之间的合作。 本文转载自我爱计算机视觉 作者 | Huang Ziqi 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、 ......
2023CVPR_Learning a Simple Low-light Image Enhancer from Paired Low-light Instances(PairLIE)
1、nn.ReflectionPad2d 对输入图像以最外围像素为对称轴,做四周的轴对称镜像填充。 大佬链接:(14条消息) torch.nn.ReflectionPad2d()的用法简介_nn.reflectionpad2d(1)_啊菜来了的博客-CSDN博客 # 对四周都填充3行 nn.Refl ......
CVPR 2023 | 神经网络超体?新国立LV lab提出全新网络克隆技术
前言 神经网络开发到 100% 会发生什么?神经网络的究极形态又是什么?何为网络超体?上述问题的答案可能可以在电影超体(Lucy)中找到。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各 ......
2022CVPR_SNR-Aware Low-light Image Enhancement(SNR)
一. motivation 二. contribution 三.Network 1. 对于低光照的图片首先采用公式2获得SNR Map (1) Ig:是低光图片 :是经过cv.blur进行均值滤波后的图像 (2) 对Ig和Ig' 取得灰度图进行绝对值相减得到噪声N (3)SNR(mask):均值滤波 ......