ICCV

Swin Transformer 马尔奖论文(ICCV 2021最佳论文)

目录 简介 作者之一的微软亚研院的首席研究员胡瀚老师在bibili讲过该论文 swin transformer比ViT做的更好的原因之一就是它将图片的一些特性嵌入到了网络模型之中,比如说平移不变性和尺寸不变性等,这样使得网络能够在cv领域做的更好。 该文章提出的Swin Transformer可以被 ......
论文 Transformer Swin ICCV 2021

2023ICCV_FSI Frequency and Spatial Interactive Learning for Image Restoration in Under-Display Cameras

三. Network 1. 2. FLB: 没看懂是怎么分离的水平和竖直方向 3. SLB:每一层保留一半的通道特征用于细化,其余的在特征重构后输出(没看懂)。 Multi-distillation Network 超分辨网络的Multi-distillation Network(2019ACMMM ......

2023ICCV_Feature Modulation Transformer: Cross-Refinement of Global Representation via High-Frequency Prior for Image Super-Resolution

一. Motivation 1. transformer的工作主要集中在设计transformer块以获得全局信息,而忽略了合并高频先验的潜力 2. 关于频率对性能的影响的详细分析有限(Additionally, there is limited detailed analysis of the i ......

Guo_AD-NeRF_Audio_Driven_Neural_Radiance_Fields_for_Talking_Head_Synthesis_ICCV_2021_paper

可以看看这个向量场的虚拟人像的效果. 看论文第三章: 3.2: F_theta是一个神经网络, a是声音 d 是view direction, x是3d location. 普通的向量场是 F_theta: d,x > (c,σ) 表示d是一个方向, 表示观看者水平的偏移角度和数值的偏移角度. x是 ......

ICCV2023 |FBANet:迈向真实世界的多帧超分

前言 本文经过练习时长3年终于做出一个超好玩的真实世界Burst Super-Resolution数据集,数据集仍在持续采集,后续会坚持更新迭代。 本文转载自我爱计算机视觉 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘 ......
FBANet 世界 ICCV 2023

ICCV 2023 | 通用数据增强技术,随机量化适用于任意数据模态

前言 本文提出了一种适用于任意数据模态的自监督学习数据增强技术。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 【CV技术指南】CV全栈指导班、基础 ......
模态 数据 技术 ICCV 2023

2023ICCV_Generalized Lightness Adaptation with Channel Selective Normalization

一. Motivatetion 跨域效果不好:在已知亮度的数据集上表现良好,在未知亮度的数据集上表现不好,泛化性能较差。 挑战:如何识别和亮度相关的通道并进行选择,并且获得泛化能力 归一化:从给定特征中提取不变的良好的良好特性,特别对于亮度分量 [ 归一化和亮度相关的特性: 1. 亮度一致性: 实例 ......

2023ICCV_Retinexformer: One-stage Retinex-based Transformer for Low-light Image Enhancement

一. Motivation (1) Retinex理论没有考虑到噪声,并且基于Retinex分解的网络通常需要很多阶段训练。 (2)直接使用从CNN从低光图像到正常光图像的映射忽略了人类的颜色感知,CNN更适合捕获局部信息,对于捕获远程依赖和非局部自相似性方面存在局限。 二.Contribution ......

ICCV 2023 清华ETH提出 Retinexformer 刷新十三大暗光增强榜单

前言 本文介绍了 ICCV 2023 上的新工作《Retinexformer: One-stage Retinex-based Transformer for Low-light Image Enhancement》 本文转载自我爱计算机视觉 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术 ......
暗光 Retinexformer ICCV 2023 ETH

ICCV 2023|利用双重聚合的Transformer进行图像超分辨率

前言 本文提出了 DAT(Dual Aggregation Transformer),是一种用于图像超分辨率 Transformer 模型。DAT 以块间和块内双重方式,聚合空间和通道特征,实现强大的建模能力。 本文转载自将门创投 作者:陈铮 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术 ......
Transformer 图像 分辨率 ICCV 2023

ICCV23|速度提高 500 倍,让 Encoder 在 3D gan Inversion 中大显身手!

前言 本文介绍了一种基于 EG3D的新颖的基于编码器的反演框架,利用 EG3D 潜在空间的固有属性来设计鉴别器和背景深度正则化,能够训练一个几何感知编码器,将输入图像转换为相应的潜在代码。本文方法取得了与基于优化的方法相当的令人印象深刻的结果,同时运行速度提高了 500 倍。 本文转载自极市平台 仅 ......
大显身手 身手 Inversion 速度 Encoder

ICCV 2023 | 超越SAM!EntitySeg:更少的数据,更高的分割质量!

前言 在本文中,High-Quality Entity Segmentation对分割问题进行了全新的探索。 本文转载自CVer 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教 ......
EntitySeg 质量 数据 ICCV 2023

ICCV 2023 Oral | 突破性图像融合与分割研究:全时多模态基准与多交互特征学习

前言 本篇文章介绍来自大连理工大学的论文Multi-interactive Feature Learning and a Full-time Multi-modality Benchmark for Image Fusion and Segmentation,收录于 ICCV 2023 Oral,研 ......
模态 全时 突破性 基准 图像

ICCV 2023 | 通过可靠、多样和类平衡的伪标签重新审视跨域三维目标检测

前言 本文介绍了 ICCV 2023 被接收的文章 Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and Class-balanced Pseudo-Labeling 的介绍。这个工作通过生成可靠、多样且类别平 ......
目标 标签 ICCV 2023

ICCV'23 | MetaBEV:传感器故障如何解决?港大&诺亚新方案!

前言 现代自动驾驶车辆的感知系统通常从互补的多模态传感器(如LiDAR和摄像机)获取输入。然而,在现实应用中,传感器损坏和故障会导致性能低下,从而影响自动驾驶的安全性。本文提出了一个鲁棒框架,称为MetaBEV,以解决极端的现实世界环境,包括整体六个传感器损坏和两个极端传感器失踪的情况。在MetaB ......
传感器 故障 MetaBEV 方案 ICCV

ICCV 2023 | 旷视研究院入选论文亮点解读

前言 近日,国际计算机视觉大会 ICCV(International Conference on Computer Vision)公布了 2023 年论文录用结果,本届会议共有 8068 篇投稿,接收率为26.8%。ICCV 是全球计算机领域顶级的学术会议,每两年召开一次,ICCV 2023 将于今 ......
研究院 亮点 论文 ICCV 2023

ICCV 2023 | Actformer:从单人到多人,迈向更加通用的3D人体动作生成

前言 本文的主要贡献为:1. 提出了基于 GAN 和 Transformer混合架构的通用 3D 人体动作生成框;2. 不仅能够实现单人动作生成,还能拓展到多人交互式动作生成;3. 基于 GTA 游戏引擎构造了一个合成的多人打架数据集,包括2~5个人同时交互,现已开源。 本文转载自PaperWeek ......
Actformer 多人 人体 动作 ICCV

ICCV论文速读:SOTA!越简单,越强大!ByteTrackV2-通用2D、3D跟踪算法(开源)

前言 本文提出了一个分层的数据关联策略来寻找低分检测框中的真实目标,这缓解了目标丢失和轨迹不连续的问题。这个简单通用的数据关联策略在2D和3D设置下都表现良好。另外,由于在3D场景中预测对象在世界坐标系中的速度比较容易,本文提出了一种辅助的运动预测策略,将检测到的速度与卡尔曼滤波器结合起来,以解决运 ......
算法 ByteTrackV2 ByteTrackV 论文 ICCV

ICCV 2023 | PVT++:通用的端对端预测性跟踪框架

前言 本文提出通用的端对端预测性跟踪框架 PVT++,旨在解决目标跟踪的部署时的延迟问题。多种预训练跟踪器在 PVT++ 框架下训练后“在线”跟踪效果大幅提高,某些情况下甚至取得了与“离线”设定相当的效果。 本文转载自PaperWeekly 作者 | Jaraxxus 仅用于学术分享,若侵权请联系删 ......
预测性 框架 ICCV 2023 PVT

ICCV 2023 | 南开大学提出LSKNet:遥感旋转目标检测新SOTA

前言 最近关于遥感物体检测的研究主要集中在改进旋转包围框的表示方法上,但忽略了遥感场景中出现的独特的先验知识。这种先验知识是非常重要的,因为微小的遥感物体可能会在没有参考足够长距离背景的情况下被错误地检测出来,而不同类型的物体所要求的长距离背景可能会有所不同。本文将这些先验因素考虑在内,并提出了 L ......
遥感 目标 LSKNet 大学 ICCV
共20篇  :1/1页 首页上一页1下一页尾页