ship-radiated fine-grained recognition learnable

Hierarchical Clustering-based Personalized Federated Learning for Robust and Fair Human Activity Recognition-2023

任务:人类活动识别任务Human Activity Recognition HAR 指标:系统准确性、公平性、鲁棒性、可扩展性 方法:1. 提出一个带有层次聚类(针对鲁棒性和公平的HAR)个性化的FL框架FedCHAR;通过聚类(利用用户之间的内在相似关系)提高模型性能的准确性、公平性、鲁棒性。 2 ......

Deep Residual Learning for Image Recognition:ResNet

Deep Residual Learning for Image Recognition * Authors: [[Kaiming He]], [[Xiangyu Zhang]], [[Shaoqing Ren]], [[Jian Sun]] DOI: 10.1109/CVPR.2016.90 初读 ......
Recognition Residual Learning ResNet Image

Local Relation Networks for Image Recognition: LRNet

Local Relation Networks for Image Recognition * Authors: [[Han Hu]], [[Zheng Zhang]], [[Zhenda Xie]], [[Stephen Lin]] DOI: 10.1109/ICCV.2019.00356 @in ......
Recognition Relation Networks Local Image

Bottleneck Transformers for Visual Recognition

Bottleneck Transformers for Visual Recognition * Authors: [[Aravind Srinivas]], [[Tsung-Yi Lin]], [[Niki Parmar]], [[Jonathon Shlens]], [[Pieter Abbee ......

Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition:使用大核卷积调制来简化注意力

Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition * Authors: [[Qibin Hou]], [[Cheng-Ze Lu]], [[Ming-Ming Cheng]], [[Jiashi Feng]] ......

《Progressive Learning of Category-Consistent Multi-Granularity Features for Fine-Grained Visual Classification》阅读笔记

论文标题 《Progressive Learning of Category-Consistent Multi-Granularity Features for Fine-Grained Visual Classification》 细粒度视觉分类中类别一致多粒度特征的渐进学习 作者 Ruoyi D ......

【论文阅读笔记】【OCR-文本识别】 SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

SEED CVPR 2020 读论文思考的问题 论文试图解决什么问题?写作背景是什么? 问题: 如何利用全局的语义信息提高文本识别模型对低质量文本的鲁棒性和识别效果? 背景: 以往的基于 encoder-decoder 的文本识别方法通常基于局部的视觉特征解码出文本,忽略了对单词显式的全局语义信息的 ......

Fine-grained Visual Classification with High-temperature Refinement and Background Suppression

摘要 细粒度视觉分类是一项具有挑战性的任务,因为类别之间的相似性很高,单个类别中数据之间的差异不同。为了应对这些挑战,以前的策略侧重于定位类别之间的细微差异并理解其中的判别特征。然而,背景还提供了重要信息,可以告诉模型哪些特征对于分类是不必要的甚至有害,并且过于依赖细微特征的模型可能会忽略全局特征和 ......

Graph Neural Networks with Learnable and Optimal Polynomial Bases

目录概符号说明MotivationFavardGNN代码 Guo Y. and Wei Z. Graph neural networks with learnable and optimal polynomial bases. ICML, 2023. 概 自动学多项式基的谱图神经网络. 符号说明 \ ......
Polynomial Learnable Networks Optimal Neural

Exercise 2 - Handwriting Recognition

Exercise 2 - Handwriting Recognition 在课程中,您学习了如何使用Fashion MNIST 进行分类,这是一个包含服装项目的数据集。还有一个类似的数据集叫做 MNIST,其中包含手写项目--数字 0 到 9。 编写一个 MNIST 分类器,训练达到 99% 或以上 ......
Handwriting Recognition Exercise

【论文阅读笔记】【OCR-文本识别】 LISTER: Neighbor Decoding for Length-Insensitive Scene Text Recognition

LISTER ICCV 2023 读论文思考的问题 论文试图解决什么问题? 由于长尾效应和错误累积等原因,现有的文本识别模型对于长文本的识别能力较差 如何提高模型对于长度较长的文本的识别能力? 文章提出了什么样的解决方法? 提出了 LISTER 模型,引入了 neighbor matrix 的概念, ......

ZYNQ_Target-Recognition Project complete

ZYNQ_Target-Recognition 描述:实现了一个卷积神经网络加速器,成功搭载Yolov3tiny。配合摄像头采集+显示器回显环路,构建了一个高性能实时目标识别与检测系统。 实现方式: Verilog实现卷积加速器的设计, C语言实现Zynq PS端的开发, Python实现神经网络的 ......

《Fine-Grained Image Analysis with Deep Learning: A Survey》阅读笔记

论文标题 《Fine-Grained Image Analysis with Deep Learning: A Survey》 作者 魏秀参,南京理工大学 初读 摘要 与上篇综述相同: 细粒度图像分析(FGIA)的任务是分析从属类别的视觉对象。 细粒度性质引起的类间小变化和类内大变化使其成为一个具有 ......

《Deep learning for fine-grained image analysis: A survey》阅读笔记

论文标题 《Deep learning for fine-grained image analysis: A survey》 作者 魏秀参,旷世研究院 初读 摘要 细粒度图像分析(FGIA)的任务是分析从属类别的视觉对象。 细粒度性质引起的类间小变化和类内大变化使其成为一个具有挑战性的问题。 本文旨 ......

《A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation》阅读笔记

论文标题 《A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation》 基于深度学习的细粒度对象分类和语义分割的综述 为什么是 “Object” 而不是 “image” 作 ......

【论文阅读笔记】【OCR-文本识别】 CLIPTER: Looking at the Bigger Picture in Scene Text Recognition

CLIPTER ICCV 2023 读论文思考的问题 论文试图解决什么问题? 现有的文本识别方法只关注于局部截取的文本区域,识别模型并没有利用全图的上下文信息,导致其可能对有挑战性的文本的识别效果较差 能否以某种方式使识别器利用上global feature的信息? 文章提出了什么样的解决方法? 提 ......
Recognition 文本 CLIPTER Looking Picture

【论文阅读笔记】【OCR-文本识别】 Scene Text Recognition with Permuted Autoregressive Sequence Models

PARSeq ECCV 2022 读论文思考的问题 论文试图解决什么问题? 一些文本识别模型会对 semantic 信息建模,从而辅助某些困难情况下的文本识别 传统的 auto-regressive 方式限制了语义信息的传输方向;双向的 auto-regressive 聚合增加了不必要的计算量和复杂 ......

《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》阅读笔记

论文标题 《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》 谷歌论文起名越来越写意了,“一幅图像值16X16个单词” 是什么玩意儿。 AT SCALE:说明适合大规模的图片识别,也许小规模的不好使 ......
IMAGE TRANSFORMERS RECOGNITION 笔记 16X16

《Deep Residual Learning for Image Recognition》阅读笔记

论文标题 《Deep Residual Learning for Image Recognition》 撑起CV界半边天的论文 Residual :主要思想,残差。 作者 何恺明,超级大佬。微软亚研院属实是人才辈出的地方。 初读 摘要 提问题: 更深层次的神经网络更难训练。 提方案: 提出了残差网络 ......
Recognition Residual Learning 笔记 Image

论文阅读(四)—— Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

![image](https://img2023.cnblogs.com/blog/3279428/202310/3279428-20231016232154691-2008412580.png) ![image](https://img2023.cnblogs.com/blog/3279428/2... ......

论文:Very deep convolutional networks for large-scale image recognition-VGG

论文名: Very deep convolutional networks for large-scale image recognition "用于大规模图像识别的深度卷积网络" 了解VGG模型 研究问题: 研究方法: 主要结论: 模型: 问题: 行文结构梳理: ......

论文阅读(三)——Channel-wise Topology Refinement Graph Convolution for Skeleton-Based Action Recognition

代码 实验 python main.py --config config/nturgbd-cross-subject/default.yaml --work-dir work_dir/ntu/csub/ctrgcn --device 0 --num-worker 0 综述 ......

【PRC】鲁棒跨域伪标记和对比学习的无监督域自适应NIR-VIS人脸识别 Robust Cross-Domain Pseudo-Labeling and Contrastive Learning for Unsupervised Domain Adaptation NIR-VIS Face Recognition

【该文章为杨学长的文章,膜拜】 探索跨领域数据中的内在关系并学习领域不变表示 由于需要在低光照条件下实现24h的人脸识别,近红外加可见光的(NIR-VIS)人脸识别受到了更多的关注。但是数据标注是一个难点。该文章提出了Robust crossdomain Pseudo-labeling and Co ......

论文精读:用于少样本图像识别的语义提示(Semantic Prompt for Few-Shot Image Recognition)

原文连接:Semantic Prompt for Few-Shot Image Recognition Abstract 在小样本学习中(Few-shot Learning, FSL)中,有通过利用额外的语义信息,如类名的文本Embedding,通过将语义原型与视觉原型相结合来解决样本稀少的问题。但 ......
语义 样本 Recognition Semantic Few-Shot

机器学习经典教材《模式识别与机器学习》,Pattern Recognition and Machine Learning,PRML官方开放免费下载

微软剑桥研究院实验室主任Christopher Bishop的经典著作《模式识别与机器学习》,Pattern Recognition and Machine Learning,简称PRML,被微软“开源”了。 本书介绍&下载页:(书的介绍页面) https://www.microsoft.com/e ......
机器 Recognition Learning 教材 Pattern

利用不可识别的人脸来增强人脸识别性能Harnessing Unrecognizable Faces for Improving Face Recognition

灰色标记:可以日后引用的观点 红色标记:好的写法、语句、单词 紫色标记:文章重点 黄色标记:寻常突出 文章评论:: 创新点:: 主要内容:: gallery中的样本通常是人为采集并精心挑选的,它们具有较好的可识别性;然而,query通常来自于真实场景,它们受多种因素干扰如像素等等。 针对“检测器能检 ......

LHY2022-HW02-Speech Recognition

# 1. 实验结果纪录 纪录一下调整参数带来的结果.不过语音识别这块完全不熟. # 1.1 Simple Baseline * **acc>0.45797** 直接上传助教代码 ![image](https://img2023.cnblogs.com/blog/2264614/202306/2264 ......
Recognition Speech 2022 LHY 02

Sep 2022-Prioritized Training on Points that are Learnable, Worth Learning, and Not Yet Learnt

提出了Reducible Holdout Loss Selection (RHOLOSS),一种简单但有原则的技术,近似地选择那些最能减少模型泛化损失的点进行训练 ......

Fine-Grained学习笔记(4):条件下界与归约,图论问题的复杂度归约理论

和P与NP问题一样,Fine-Grained领域中的许多问题也能相互归约,这意味着当这些问题中的任意一个问题的复杂度下界得到了证明或证伪,那么一系列问题的复杂度下界就都能够得到解决. APSP猜想: 不存在$O(|V|^{3-\delta})$时间的(对于任意实数边权图都有效的)(确定性的)APSP ......
复杂度 下界 Fine-Grained 条件 Grained

An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale

模型如下图所示: 将H×W×C的图像reshape成了N×(P2×C),其中(H,W)是图像的原始分辨率,C是通道数,(P,P)是每个图像块的分辨率,N=H×W/P2为图像块的数量,将一个图像块使用可学习的线性层映射到维度为D的隐藏向量,如式(1)所示,线性映射的输出称为patch embeddin ......
Image Transformers Recognition 16x16 Worth
共40篇  :1/2页 首页上一页1下一页尾页