Vision

【论文阅读】CAT: Cross Attention in Vision Transformer

论文地址：[2106.05786] CAT: Cross Attention in Vision Transformer (arxiv.org) 项目地址：https://github.com/linhezheng19/CAT 一、Abstract 由于Transformer在NLP中得到了广泛的应 ......

Transformer Attention Vision 论文 Cross更新时间 2023-09-07

【ICML2022】Understanding The Robustness in Vision Transformers

来自NUS&NVIDIA 文章地址：[2204.12451] Understanding The Robustness in Vision Transformers (arxiv.org) 项目地址：https://github.com/NVlabs/FAN 一、Motivation CNN使用滑动 ......

Understanding Transformers Robustness Vision ICML更新时间 2023-09-06

Apple Vision OS最全设计规范

Apple Vision OS最全设计规范 2023-07-18 14:13·人人都是产品经理当你需要着手为 visionOS 设计相应的APP或其他应用时，你要怎么做，才能为用户带来视觉感受和操作体验上的完善？或许你需要先了解 visionOS 的有哪些设计规范。本篇文章里，作者就汇总分析了 v ......

Vision Apple更新时间 2023-08-31

计算机视觉(Computer Vision)，计算机图形学(Computer Graphics)和数字图像(Image Processing)

计算机视觉(Computer Vision)，计算机图形学(Computer Graphics)和数字图像(Image Processing) 从学科分类： Computer Science/ Artificial Intelligence/ Computer Vision Computer Sci ......

Computer 计算机 Processing Graphics 图形更新时间 2023-08-17

Vision Pro 开发者套件现已开放申请

导读开发者现在可以通过苹果官网申请使用 Apple Vision Pro 开发者套件 (developer kit)。所谓开发者套件，可以理解为 Apple 提供给开发者的测试机。申请者需要拥有苹果开发者帐户，并提交申请详细信息。申请入口：https://developer.apple.com ......

套件开发者 Vision Pro更新时间 2023-08-09

LabVIEW图形化的AI视觉开发平台（非NI Vision）VI简介

# 前言今天想和大家分享的是：仪酷LabVIEW AI视觉工具包的VI简介，如介绍内容有误，欢迎各位朋友们帮忙纠正~ # 一、AI视觉工具包VI简介已经安装好的AI工具包位于程序框图-函数选板-Addons-VIRobotics-opencv_yiku，内容包括：Mat类型（矩阵）的操作、摄像头 ......

开发平台图形视觉 LabVIEW 简介更新时间 2023-08-08

UNIQUE VISION Programming Contest 2023 Summer(AtCoder Beginner Contest 312)

# Preface 最唐氏的一集，尽情欣赏ABC E题战俘的丑态这场打的时候就很抽象，各种傻逼错误频发，从B题一路WA到G题还好发现E后面的题更简单后马上把FG写了，不然要爆炸了 # A - Chord 签到 ```cpp #include #include #include #include ......

Contest Programming Beginner AtCoder UNIQUE更新时间 2023-08-01

[UNIQUE VISION Programming Contest 2023 Summer(AtCoder Beginner Contest 312) - AtCoder](https://atcoder.jp/contests/abc312)

# [UNIQUE VISION Programming Contest 2023 Summer(AtCoder Beginner Contest 312) - AtCoder](https://atcoder.jp/contests/abc312) ## [A - Chord (atcoder.j ......

Contest AtCoder Programming 312 Beginner更新时间 2023-07-30

Vision Transformer

Vision Transformer 本文关注ViT论文`4.5 Inspecting Vision Transformer`可视化的原理及实现，此外还对ViT pytorch源码实现进行理解 [toc] # Introduction [论文地址](arXiv:2010.11929) ## Titl ......

Transformer Vision更新时间 2023-07-27

[论文速览] A Closer Look at Self-supervised Lightweight Vision Transformers

## Pre title: A Closer Look at Self-supervised Lightweight Vision Transformers accepted: ICML 2023 paper: https://arxiv.org/abs/2205.14443 code: https ......

Self-supervised Transformers Lightweight supervised Closer更新时间 2023-07-15

我用numpy实现了VIT，手写vision transformer, 可在树莓派上运行，在hugging face上训练模型保存参数成numpy格式，纯numpy实现

先复制一点知乎上的内容按照上面的流程图，一个ViT block可以分为以下几个步骤 (1) patch embedding：例如输入图片大小为224x224，将图片分为固定大小的patch，patch大小为16x16，则每张图像会生成224x224/16x16=196个patch，即输入序列长度为 ......

numpy 树莓 transformer 可在模型更新时间 2023-07-11

【论文阅读】CrossViT：Cross-Attention Multi-Scale Vision Transformer for Image Classification

> # 🚩前言 > > - 🐳博客主页：😚[睡晚不猿序程](https://www.cnblogs.com/whp135/)😚 > - ⌚首发时间：23.7.10 > - ⏰最近更新时间：23.7.10 > - 🙆本文由 **睡晚不猿序程** 原创 > - 🤡作者是蒻蒟本蒟，如果文章里有 ......

Cross-Attention Classification Multi-Scale Transformer Attention更新时间 2023-07-10

【论文阅读】CrossFormer: A Versatile Vision Transformer Based on Cross-scale Attention

来自CVPR 2021 论文地址：https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/2108.00154.pdf 代码地址：https://link.zhihu.com/?target=https%3A//github.com/cheers ......

CrossFormer Cross-scale Transformer Attention Versatile更新时间 2023-07-06

【论文阅读】Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions

来自ICCV2021 论文地址：[2102.12122] Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions (arxiv.org) 代码地址：https://link. ......

Convolutions Transformer Prediction Versatile Backbone更新时间 2023-07-04

Vision Transformer(VIT)

VIT主要用于分类任务一、VIT，即纯transformer模型图1 VIT 架构 VIT模型的架构如图1所示。主要分为三个步骤： 1. 首先将输入的图片分成patches（如16*16的patch），然后将每个patch输入到Embedding层（即Linear Projection of F ......

Transformer Vision VIT更新时间 2023-07-03

UNIQUE VISION Programming Contest 2023 New Year (AtCoder Beginner Contest 287) ABCDE

# [UNIQUE VISION Programming Contest 2023 New Year (AtCoder Beginner Contest 287)](https://atcoder.jp/contests/abc287) ## A - Majority ### Problem Sta ......

Contest Programming Beginner AtCoder UNIQUE更新时间 2023-06-12

【论文阅读】Pyramid Vision Transformer：A Versatile Backbone for Dense Prediction Without Convolutions

> # 🚩前言 > > - 🐳博客主页：😚[睡晚不猿序程](https://www.cnblogs.com/whp135/)😚 > - ⌚首发时间：2023.6.11 > - ⏰最近更新时间：2023.6.11 > - 🙆本文由 **睡晚不猿序程** 原创 > - 🤡作者是蒻蒟本蒟，如果 ......

Convolutions Transformer Prediction Versatile Backbone更新时间 2023-06-11

【论文阅读】CvT：Introducing Convolutions to Vision Transformers

> # 🚩前言 > > - 🐳博客主页：😚[睡晚不猿序程](https://www.cnblogs.com/whp135/)😚 > - ⌚首发时间： > - ⏰最近更新时间： > - 🙆本文由 **睡晚不猿序程** 原创 > - 🤡作者是蒻蒟本蒟，如果文章里有任何错误或者表述不清，请 t ......

Convolutions Transformers Introducing Vision 论文更新时间 2023-06-10

【论文阅读】Masked Autoencoders Are Scalable Vision Learners

> # 🚩前言 > > - 🐳博客主页：😚[睡晚不猿序程](https://www.cnblogs.com/whp135/)😚 > - ⌚首发时间：2023.6.10 > - ⏰最近更新时间：2023.6.10 > - 🙆本文由 **睡晚不猿序程** 原创 > - 🤡作者是蒻蒟本蒟，如果 ......

Autoencoders Learners Scalable Masked Vision更新时间 2023-06-10

我们不一样-康耐视visionpro和apple vision pro

康耐视Visionpro是美国cognex visionpro。康耐视 VisionPro 是领先的计算机式视觉软件。它主要用于设置和部署视觉应用 - 无论是使用相机还是图像采集卡。借助 VisionPro，用户可执行各种功能，包括几何对象定位和检测、识别、测量和对准，以及针对半导体和电子产品应 ......

visionpro vision apple pro更新时间 2023-06-08

Apple Vision Pro All In One

Apple Vision Pro All In One 以下是内容全部是个人观点，仅供参考！优点一款具有跨时代技术革命的 VR/AR 眼镜; UI 交互体验一如既往丝滑、简洁、易用的 Apple 风格; 可以取代大屏显示器、大屏电视、电影院的巨幕等外部显示设备; ... 缺点目前价格太贵，不... ......

Vision Apple All Pro One更新时间 2023-06-06

苹果耳机Vision Pro的最新消息

今天，在一年一度的WWDC 2023 大会上，Apple 揭开了传闻已久的增强现实 (AR) 耳机Vision Pro的神秘面纱。Vision Pro是 Apple 迄今为止最雄心勃勃的产品之一 - 历时一年的制造和丰富的技术足以保证天价。但今天的公告不仅仅包含硬件。除了 Vision Pro 之 ......

最新消息耳机苹果消息 Vision更新时间 2023-06-06

EmbodiedGPT: Vision-Language Pre-Training via Embodied Chain of Thought

Abstract: 具身人工智能(Embodied AI)让机器人有规划、执行动作序列的能力，以在物理环境中完成长期任务。本文提出EmbodiedGPT，它是一个端到端的多模态基础模型，赋予具身代理多模态理解和执行能力。本文的贡献主要有三点：制作了一个大规模的具身规划数据集EgoCOT。该数据集包 ......

Vision-Language Pre-Training EmbodiedGPT Embodied Language更新时间 2023-05-29

CABINET VISION 2023.1

Here are some of the key updated functions of the CABINET VISION 2023.1 release. Welcome Screen Place Sub-Assembly in Section Editor Assembly Level... ......

CABINET 2023.1 VISION 2023更新时间 2023-05-26

论文阅读笔记（五）：Hire-MLP Vision MLP via Hierarchical Rearrangement

论文阅读笔记（五）：Hire-MLP: Vision MLP via Hierarchical Rearrangement 摘要先前的MLPs网络接受flattened 图像patches作为输入，使得他们对于不同的输入大小缺乏灵活性，并且难以捕捉空间信息，本问Hire-MLP通过层次化重排构建视 ......

Rearrangement Hierarchical MLP Hire-MLP 笔记更新时间 2023-03-24

论文解读（Moco v3）《An Empirical Study of Training Self-Supervised Vision Transformers》

论文信息论文标题：Improved Baselines with Momentum Contrastive Learning论文作者：Xinlei Chen, Saining Xie, Kaiming He论文来源：2021 ICCV论文地址：download 论文代码：download引用次数： ......

Self-Supervised Transformers Supervised Empirical Training更新时间 2023-03-22

【手搓模型】亲手实现 Vision Transformer

🚩前言 🐳博客主页：😚睡晚不猿序程😚 ⌚首发时间：2023.3.17，首发于博客园 ⏰最近更新时间：2023.3.17 🙆本文由睡晚不猿序程原创 🤡作者是蒻蒟本蒟，如果文章里有任何错误或者表述不清，请 tt 我，万分感谢！orz 相关文章目录：无目录 1. 内容简介最近在准备使 ......

Transformer 模型 Vision更新时间 2023-03-22

共57篇 :2/2页 首页上一页12下一页尾页