Recognition

Hierarchical Clustering-based Personalized Federated Learning for Robust and Fair Human Activity Recognition-2023

任务：人类活动识别任务Human Activity Recognition HAR 指标：系统准确性、公平性、鲁棒性、可扩展性方法：1. 提出一个带有层次聚类（针对鲁棒性和公平的HAR）个性化的FL框架FedCHAR；通过聚类（利用用户之间的内在相似关系）提高模型性能的准确性、公平性、鲁棒性。 2 ......

Clustering-based Hierarchical Personalized Recognition Clustering更新时间 2023-12-20

Deep Residual Learning for Image Recognition：ResNet

Deep Residual Learning for Image Recognition * Authors: [[Kaiming He]], [[Xiangyu Zhang]], [[Shaoqing Ren]], [[Jian Sun]] DOI: 10.1109/CVPR.2016.90 初读 ......

Recognition Residual Learning ResNet Image更新时间 2023-12-18

Local Relation Networks for Image Recognition： LRNet

Local Relation Networks for Image Recognition * Authors: [[Han Hu]], [[Zheng Zhang]], [[Zhenda Xie]], [[Stephen Lin]] DOI: 10.1109/ICCV.2019.00356 @in ......

Recognition Relation Networks Local Image更新时间 2023-12-18

Bottleneck Transformers for Visual Recognition

Bottleneck Transformers for Visual Recognition * Authors: [[Aravind Srinivas]], [[Tsung-Yi Lin]], [[Niki Parmar]], [[Jonathon Shlens]], [[Pieter Abbee ......

Transformers Recognition Bottleneck Visual for更新时间 2023-12-18

Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition：使用大核卷积调制来简化注意力

Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition * Authors: [[Qibin Hou]], [[Cheng-Ze Lu]], [[Ming-Ming Cheng]], [[Jiashi Feng]] ......

卷积 Transformer-Style Conv2Former Recognition Transformer更新时间 2023-12-17

【论文阅读笔记】【OCR-文本识别】 SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

SEED CVPR 2020 读论文思考的问题论文试图解决什么问题？写作背景是什么？问题：如何利用全局的语义信息提高文本识别模型对低质量文本的鲁棒性和识别效果？背景：以往的基于 encoder-decoder 的文本识别方法通常基于局部的视觉特征解码出文本，忽略了对单词显式的全局语义信息的 ......

Encoder-Decoder Recognition Framework Semantics Enhanced更新时间 2023-12-12

Exercise 2 - Handwriting Recognition

Exercise 2 - Handwriting Recognition 在课程中，您学习了如何使用Fashion MNIST 进行分类，这是一个包含服装项目的数据集。还有一个类似的数据集叫做 MNIST，其中包含手写项目--数字 0 到 9。编写一个 MNIST 分类器，训练达到 99% 或以上 ......

Handwriting Recognition Exercise更新时间 2023-11-30

【论文阅读笔记】【OCR-文本识别】 LISTER: Neighbor Decoding for Length-Insensitive Scene Text Recognition

LISTER ICCV 2023 读论文思考的问题论文试图解决什么问题？由于长尾效应和错误累积等原因，现有的文本识别模型对于长文本的识别能力较差如何提高模型对于长度较长的文本的识别能力？文章提出了什么样的解决方法？提出了 LISTER 模型，引入了 neighbor matrix 的概念， ......

Length-Insensitive Insensitive Recognition Decoding Neighbor更新时间 2023-11-30

ZYNQ_Target-Recognition Project complete

ZYNQ_Target-Recognition 描述：实现了一个卷积神经网络加速器，成功搭载Yolov3tiny。配合摄像头采集+显示器回显环路，构建了一个高性能实时目标识别与检测系统。实现方式： Verilog实现卷积加速器的设计， C语言实现Zynq PS端的开发， Python实现神经网络的 ......

ZYNQ_Target-Recognition Recognition complete Project Target更新时间 2023-11-22

【论文阅读笔记】【OCR-文本识别】 CLIPTER: Looking at the Bigger Picture in Scene Text Recognition

CLIPTER ICCV 2023 读论文思考的问题论文试图解决什么问题？现有的文本识别方法只关注于局部截取的文本区域，识别模型并没有利用全图的上下文信息，导致其可能对有挑战性的文本的识别效果较差能否以某种方式使识别器利用上global feature的信息？文章提出了什么样的解决方法？提 ......

Recognition 文本 CLIPTER Looking Picture更新时间 2023-11-12

【论文阅读笔记】【OCR-文本识别】 Scene Text Recognition with Permuted Autoregressive Sequence Models

PARSeq ECCV 2022 读论文思考的问题论文试图解决什么问题？一些文本识别模型会对 semantic 信息建模，从而辅助某些困难情况下的文本识别传统的 auto-regressive 方式限制了语义信息的传输方向；双向的 auto-regressive 聚合增加了不必要的计算量和复杂 ......

Autoregressive Recognition Permuted Sequence 文本更新时间 2023-11-09

《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》阅读笔记

论文标题《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》谷歌论文起名越来越写意了，“一幅图像值16X16个单词” 是什么玩意儿。 AT SCALE：说明适合大规模的图片识别，也许小规模的不好使 ......

IMAGE TRANSFORMERS RECOGNITION 笔记 16X16更新时间 2023-11-05

《Deep Residual Learning for Image Recognition》阅读笔记

论文标题《Deep Residual Learning for Image Recognition》撑起CV界半边天的论文 Residual ：主要思想，残差。作者何恺明，超级大佬。微软亚研院属实是人才辈出的地方。初读摘要提问题：更深层次的神经网络更难训练。提方案：提出了残差网络 ......

Recognition Residual Learning 笔记 Image更新时间 2023-10-17

论文阅读（四）—— Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

![image](https://img2023.cnblogs.com/blog/3279428/202310/3279428-20231016232154691-2008412580.png) ![image](https://img2023.cnblogs.com/blog/3279428/2... ......

Skeleton-Based Convolutional Recognition Networks Skeleton更新时间 2023-10-16

论文：Very deep convolutional networks for large-scale image recognition-VGG

论文名： Very deep convolutional networks for large-scale image recognition "用于大规模图像识别的深度卷积网络" 了解VGG模型研究问题：研究方法: 主要结论：模型: 问题：行文结构梳理： ......

recognition-VGG convolutional large-scale recognition networks更新时间 2023-10-16

论文阅读（三）——Channel-wise Topology Refinement Graph Convolution for Skeleton-Based Action Recognition

代码实验 python main.py --config config/nturgbd-cross-subject/default.yaml --work-dir work_dir/ntu/csub/ctrgcn --device 0 --num-worker 0 综述 ......

Skeleton-Based Channel-wise Convolution Recognition Refinement更新时间 2023-10-16

【PRC】鲁棒跨域伪标记和对比学习的无监督域自适应NIR-VIS人脸识别 Robust Cross-Domain Pseudo-Labeling and Contrastive Learning for Unsupervised Domain Adaptation NIR-VIS Face Recognition

【该文章为杨学长的文章，膜拜】探索跨领域数据中的内在关系并学习领域不变表示由于需要在低光照条件下实现24h的人脸识别，近红外加可见光的(NIR-VIS)人脸识别受到了更多的关注。但是数据标注是一个难点。该文章提出了Robust crossdomain Pseudo-labeling and Co ......

NIR-VIS Domain 人脸 Pseudo-Labeling Cross-Domain更新时间 2023-10-15

共26篇 :1/1页 首页上一页1下一页尾页

526互联

Recognition

Hierarchical Clustering-based Personalized Federated Learning for Robust and Fair Human Activity Recognition-2023

Deep Residual Learning for Image Recognition：ResNet

Local Relation Networks for Image Recognition： LRNet

Bottleneck Transformers for Visual Recognition

Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition：使用大核卷积调制来简化注意力

【论文阅读笔记】【OCR-文本识别】 SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

Exercise 2 - Handwriting Recognition

【论文阅读笔记】【OCR-文本识别】 LISTER: Neighbor Decoding for Length-Insensitive Scene Text Recognition

ZYNQ_Target-Recognition Project complete

【论文阅读笔记】【OCR-文本识别】 CLIPTER: Looking at the Bigger Picture in Scene Text Recognition

【论文阅读笔记】【OCR-文本识别】 Scene Text Recognition with Permuted Autoregressive Sequence Models

《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》阅读笔记

《Deep Residual Learning for Image Recognition》阅读笔记

论文阅读（四）—— Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

论文：Very deep convolutional networks for large-scale image recognition-VGG

论文阅读（三）——Channel-wise Topology Refinement Graph Convolution for Skeleton-Based Action Recognition

【PRC】鲁棒跨域伪标记和对比学习的无监督域自适应NIR-VIS人脸识别 Robust Cross-Domain Pseudo-Labeling and Contrastive Learning for Unsupervised Domain Adaptation NIR-VIS Face Recognition

论文精读：用于少样本图像识别的语义提示（Semantic Prompt for Few-Shot Image Recognition）

机器学习经典教材《模式识别与机器学习》，Pattern Recognition and Machine Learning，PRML官方开放免费下载

利用不可识别的人脸来增强人脸识别性能Harnessing Unrecognizable Faces for Improving Face Recognition

LHY2022-HW02-Speech Recognition

An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale

Adaptive ship-radiated noise recognition with learnable fine-grained wavelet transform

论文解读（CosFace）《CosFace: Large Margin Cosine Loss for Deep Face Recognition》

python的人脸识别库face_recognition

迁移学习（SOT）《Cross-domain Activity Recognition via Substructural Optimal Transport》