handwriting recognition exercise
Hierarchical Clustering-based Personalized Federated Learning for Robust and Fair Human Activity Recognition-2023
任务:人类活动识别任务Human Activity Recognition HAR 指标:系统准确性、公平性、鲁棒性、可扩展性 方法:1. 提出一个带有层次聚类(针对鲁棒性和公平的HAR)个性化的FL框架FedCHAR;通过聚类(利用用户之间的内在相似关系)提高模型性能的准确性、公平性、鲁棒性。 2 ......
Deep Residual Learning for Image Recognition:ResNet
Deep Residual Learning for Image Recognition * Authors: [[Kaiming He]], [[Xiangyu Zhang]], [[Shaoqing Ren]], [[Jian Sun]] DOI: 10.1109/CVPR.2016.90 初读 ......
Local Relation Networks for Image Recognition: LRNet
Local Relation Networks for Image Recognition * Authors: [[Han Hu]], [[Zheng Zhang]], [[Zhenda Xie]], [[Stephen Lin]] DOI: 10.1109/ICCV.2019.00356 @in ......
Bottleneck Transformers for Visual Recognition
Bottleneck Transformers for Visual Recognition * Authors: [[Aravind Srinivas]], [[Tsung-Yi Lin]], [[Niki Parmar]], [[Jonathon Shlens]], [[Pieter Abbee ......
Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition:使用大核卷积调制来简化注意力
Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition * Authors: [[Qibin Hou]], [[Cheng-Ze Lu]], [[Ming-Ming Cheng]], [[Jiashi Feng]] ......
【论文阅读笔记】【OCR-文本识别】 SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition
SEED CVPR 2020 读论文思考的问题 论文试图解决什么问题?写作背景是什么? 问题: 如何利用全局的语义信息提高文本识别模型对低质量文本的鲁棒性和识别效果? 背景: 以往的基于 encoder-decoder 的文本识别方法通常基于局部的视觉特征解码出文本,忽略了对单词显式的全局语义信息的 ......
Exercises
To: Team MembersSubject: New Year Party Planning Date: [Specify the date for the New Year party]Time: [Specify the start and end time of the event]Ven ......
Exercise 2 - Handwriting Recognition
Exercise 2 - Handwriting Recognition 在课程中,您学习了如何使用Fashion MNIST 进行分类,这是一个包含服装项目的数据集。还有一个类似的数据集叫做 MNIST,其中包含手写项目--数字 0 到 9。 编写一个 MNIST 分类器,训练达到 99% 或以上 ......
Exercise 3 - Convolutions
Exercise 3 - Convolutions 在视频中,您了解了如何使用卷积来改进时尚 MNIST。在练习中,请看您能否仅使用一个卷积层和一个 MaxPooling 2D 将 MNIST 的准确率提高到 99.8% 或更高。一旦准确率超过这一水平,就应停止训练。这应该在 20 个历元以内完成, ......
Exercise 1 - House Prices
Exercise 1 - House Prices 在这个练习中,你将尝试建立一个神经网络,根据一个简单的公式预测房屋的价格。 想象一下,如果房屋定价简单到每间卧室的价格为 5 万 + 5 万,那么一间卧室的房屋价格为 10 万,两间卧室的房屋价格为 15 万等等。 你将如何创建一个神经网络来学习这 ......
Exercise 4 - Handling Complex Images
Exercise 4 - Handling Complex Images 下面是代码,链接到一个包含 80 张图像(40 张快乐图像和 40 张悲伤图像)的快乐或悲伤数据集。创建一个卷积神经网络,对这些图像进行 100%准确率的训练,当训练准确率大于 0.999 时取消训练。 提示:最好使用 3 个 ......
【论文阅读笔记】【OCR-文本识别】 LISTER: Neighbor Decoding for Length-Insensitive Scene Text Recognition
LISTER ICCV 2023 读论文思考的问题 论文试图解决什么问题? 由于长尾效应和错误累积等原因,现有的文本识别模型对于长文本的识别能力较差 如何提高模型对于长度较长的文本的识别能力? 文章提出了什么样的解决方法? 提出了 LISTER 模型,引入了 neighbor matrix 的概念, ......
ZYNQ_Target-Recognition Project complete
ZYNQ_Target-Recognition 描述:实现了一个卷积神经网络加速器,成功搭载Yolov3tiny。配合摄像头采集+显示器回显环路,构建了一个高性能实时目标识别与检测系统。 实现方式: Verilog实现卷积加速器的设计, C语言实现Zynq PS端的开发, Python实现神经网络的 ......
【论文阅读笔记】【OCR-文本识别】 CLIPTER: Looking at the Bigger Picture in Scene Text Recognition
CLIPTER ICCV 2023 读论文思考的问题 论文试图解决什么问题? 现有的文本识别方法只关注于局部截取的文本区域,识别模型并没有利用全图的上下文信息,导致其可能对有挑战性的文本的识别效果较差 能否以某种方式使识别器利用上global feature的信息? 文章提出了什么样的解决方法? 提 ......
【论文阅读笔记】【OCR-文本识别】 Scene Text Recognition with Permuted Autoregressive Sequence Models
PARSeq ECCV 2022 读论文思考的问题 论文试图解决什么问题? 一些文本识别模型会对 semantic 信息建模,从而辅助某些困难情况下的文本识别 传统的 auto-regressive 方式限制了语义信息的传输方向;双向的 auto-regressive 聚合增加了不必要的计算量和复杂 ......
《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》阅读笔记
论文标题 《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》 谷歌论文起名越来越写意了,“一幅图像值16X16个单词” 是什么玩意儿。 AT SCALE:说明适合大规模的图片识别,也许小规模的不好使 ......
Exercise: Create a static HTML web app by using Azure Cloud Shell
https://learn.microsoft.com/en-us/training/modules/introduction-to-azure-app-service/7-create-html-web-app resourceGroup=$(az group list --query "[].{ ......
《Deep Residual Learning for Image Recognition》阅读笔记
论文标题 《Deep Residual Learning for Image Recognition》 撑起CV界半边天的论文 Residual :主要思想,残差。 作者 何恺明,超级大佬。微软亚研院属实是人才辈出的地方。 初读 摘要 提问题: 更深层次的神经网络更难训练。 提方案: 提出了残差网络 ......
论文阅读(四)—— Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition
![image](https://img2023.cnblogs.com/blog/3279428/202310/3279428-20231016232154691-2008412580.png) ![image](https://img2023.cnblogs.com/blog/3279428/2... ......
论文:Very deep convolutional networks for large-scale image recognition-VGG
论文名: Very deep convolutional networks for large-scale image recognition "用于大规模图像识别的深度卷积网络" 了解VGG模型 研究问题: 研究方法: 主要结论: 模型: 问题: 行文结构梳理: ......
论文阅读(三)——Channel-wise Topology Refinement Graph Convolution for Skeleton-Based Action Recognition
代码 实验 python main.py --config config/nturgbd-cross-subject/default.yaml --work-dir work_dir/ntu/csub/ctrgcn --device 0 --num-worker 0 综述 ......
【PRC】鲁棒跨域伪标记和对比学习的无监督域自适应NIR-VIS人脸识别 Robust Cross-Domain Pseudo-Labeling and Contrastive Learning for Unsupervised Domain Adaptation NIR-VIS Face Recognition
【该文章为杨学长的文章,膜拜】 探索跨领域数据中的内在关系并学习领域不变表示 由于需要在低光照条件下实现24h的人脸识别,近红外加可见光的(NIR-VIS)人脸识别受到了更多的关注。但是数据标注是一个难点。该文章提出了Robust crossdomain Pseudo-labeling and Co ......
论文精读:用于少样本图像识别的语义提示(Semantic Prompt for Few-Shot Image Recognition)
原文连接:Semantic Prompt for Few-Shot Image Recognition Abstract 在小样本学习中(Few-shot Learning, FSL)中,有通过利用额外的语义信息,如类名的文本Embedding,通过将语义原型与视觉原型相结合来解决样本稀少的问题。但 ......
机器学习经典教材《模式识别与机器学习》,Pattern Recognition and Machine Learning,PRML官方开放免费下载
微软剑桥研究院实验室主任Christopher Bishop的经典著作《模式识别与机器学习》,Pattern Recognition and Machine Learning,简称PRML,被微软“开源”了。 本书介绍&下载页:(书的介绍页面) https://www.microsoft.com/e ......
利用不可识别的人脸来增强人脸识别性能Harnessing Unrecognizable Faces for Improving Face Recognition
灰色标记:可以日后引用的观点 红色标记:好的写法、语句、单词 紫色标记:文章重点 黄色标记:寻常突出 文章评论:: 创新点:: 主要内容:: gallery中的样本通常是人为采集并精心挑选的,它们具有较好的可识别性;然而,query通常来自于真实场景,它们受多种因素干扰如像素等等。 针对“检测器能检 ......
Go - A Tour of Go Exercise: Stringers
package main import ( "fmt" "strings" "strconv" ) type IPAddr [4]byte func (ip IPAddr) String() string { s := make([]string, len(ip)) for i, val := ra ......
Go - A Tour of Go Exercise: Fibonacci closure
package main import "fmt" // fibonacci is a function that returns // a function that returns an int. func fibonacci() func() int { f0, f1 := 0, 1 retu ......
[论文速览] Handwriting Transformers
## Pre title: Handwriting Transformers accepted: ICCV 2021 paper: https://arxiv.org/abs/2104.03964 code: https://github.com/ankanbhunia/Handwriting-Tr ......
Exercise: Web Crawler
这个Exercise已经把功能框架写好了,只需要额外实现: 每次分析一个URL时,并发处理该URL下所有子URL。实现的时候,将原有的Crawl用一个匿名func包起来,并在Crawl后面加一个chan写入(解除后面对应的chan读取阻塞),然后在for的外层加一个和for相同次数的chan读取来阻 ......
Exercise: Equivalent Binary Trees
这个Exercise的答案比较开放,不过遵循说明里面的基本要求: Walk遍历随机创建的有序2叉树,将值写入一个chan,按从小到大的顺序输出10个结果。需要注意的是,这个Exercise的随机2叉树说明里面明确了是tree.New(k)创建k, 2k, ..., 10k。所以输出的时候直接循环读1 ......