Convolutional neural network (CNN)–extreme learning machine (ELM)

发布时间 2023-08-14 16:42:35作者: freedragon

1. 介绍

论文:(2020)Neural networks for facial age estimation: a survey on recent advances.

地址:

http://link.springer.com/article/10.1007/s10462-019-09765-w

针对问题:软生物识别技术在现实世界中的应用日益增多,已成为研究人员感兴趣的一个新领域。它包括对年龄、性别、伤疤、种族等人口特征的估计。此外,研究人员正试图开发一种模型,该模型能够准确估计使用不同生物特征的人的年龄或年龄组。目前,神经网络在人脸年龄估计中得到了很好的分类结果。因此,本篇综述调查并比较了2010年至2019年间为面部年龄估计开发和实施的一些神经网络模型。精确地比较了迄今为止26项不同的研究工作,以使用神经网络从人脸估计年龄。大部分工作基于卷积神经网络,少数工作基于前馈-反向传播和自动编码器。深入讨论每项工作的重要细节、问题和结果,以便感兴趣的研究人员更好地了解。本文还详细介绍了用于面部年龄估计的其他分类技术,以全面了解科学家迄今为止采用的所有其他技术。采用神经网络模型名称、使用的数据集、主要贡献、评估指标和结果等详细信息进行表格形式的、易于理解的比较研究。最后,论文最后提到了在这一具有挑战性的研究领域可以完成的其他相关未来研究任务。

 

综述逻辑:

  • 关于面部年龄估计的应用和面临的挑战;

  • 综述人工神经网络和卷积神经网络;

  • 基于神经网络的面部年龄估计模型的最新进展;

  • 比较基于神经网络的面部年龄估计的最新进展;

  • 结论和未来工作。

     

2. 年龄估计:应用和挑战

近年来,面部年龄的自动估计已经覆盖了广泛的应用领域。年龄估计服务于刑事调查,根据从不同来源收集的年龄信息确定被告。由于自动化的年龄估计,商业用户管理现在已经进步,因为现在可以根据年龄组甚至一个人的性别来个性化购物体验。现在可以管理客户的不同偏好和期望,监控市场趋势,定制产品和服务以满足公众需求。此外,年龄估计可用于各种监视和安全目的,如防止未成年人观看 、浏览 网页、饮酒和购买任何其他年龄限制的材料。年龄估计在人类身份识别中有很多应用。它可以用来从以前的图像中识别失踪的老人。访问控制的应用包括限制儿童在电视或互联网上观看不需要的内容。当年龄估计与虹膜识别、人脸识别、手部识别、指纹识别或任何其他生物特征一起应用时,可以提高生物识别系统的性能。在招聘过程中,年龄估计也可以在确定新员工的年龄或寻找刚到退休年龄的员工方面发挥重要作用。年龄估计的其他主要应用领域包括视频监控、人机交互、执法、推荐系统娱乐、社交媒体分析、人口数据收集、种族分类、医学、智能监控、精准广告和心理学。

面部年龄估计也面临许多挑战。由于年龄依赖于精确的特征,因此无法估计准确的年龄。到目前为止,年龄组估计是唯一可能的。此外,一个包含所有年龄和性别信息的良好数据库的可用性有限,无法进行深入研究。大量标记数据也给面部年龄估计带来了问题。由于胡须、胡须、眼镜等原因而产生的伪装等因素加剧了面部年龄自动估计所面临的障碍。皮肤感染、化妆、饮食、成年期的皮肤质地变化和童年期的面部形状变化也掩盖了面部年龄。微笑、皱眉、大笑、哭泣等面部表情会在额头、脸颊、眼周区、嘴巴或鼻子等部位产生皱纹,从而影响准确的年龄估计。真实世界中的姿势、遮挡、闪电、颜色模式和种族等环境问题也会影响年龄估计任务。

图片

上图a显示了LAP年龄估计数据集中的一些样本图像。每个图像都提供了表观年龄和标准偏差。这些图像清楚地说明了在面部年龄估计过程中所面临的各种挑战,如眼镜、姿势、照明和表情。此外,性别是造成实际和表面年龄估计差异的另一个因素。同龄的男性和女性在面部特征上存在重大差异,这在年龄估计中是一个重大挑战。图b显示了男性和女性在衰老过程中的这种差异。其他一些主要因素包括健康问题、生活方式、生活环境、职业和基因。所有这些影响面部衰老的因素可分为外在因素和内在因素。

 

3. Artificial neural networks

图片

 

4. Convolutional neural networks

4.1  AlexNet

图片

 

4.2  VGG‑16

图片

 

4.3  GoogLeNet

图片

4.4  DAG‑CNN

图片

4.5  ResNet

图片

 

5. 基于神经网络的面部年龄估计最新进展

5.1前馈-反向传播人工神经网络(FFBPANN)

论文:(2010) A new algorithm for age recognition from facial images

简述:作者所做的其他各种比较研究包括,将所提出的方法的精度结果与其他两项最先进的工作进行比较,在IFDB上比较各种误差限制下的眼睛定位方法。该方法在小于0.15%的误差范围内获得82.28%的准确度。

 

5.2  BPANN combined with gene expression programming (GEP)

论文:(2015) Artificial neural networks and gene expression programing based age estimation using facial features

简述:这项研究在FG-NET数据库上实现两种不同的技术,即卷积神经网络(CNN)和基因表达编程(GEP)。仅使用在良好照明条件下拍摄的无玻璃、无模糊、无胡须和定向良好的正面图像。通过将年龄分为(0-17)、(18-34)、(34-50)和(51-69)四大类进行年龄估计。作者检测的神经元最小值和最大值分别为29和43。对于29个神经元,MSE为0.12,总体正确分类率为75.8%。对于43个神经元,MSE为0.11,总体正确分类率为70.07%。

 

5.3  Deep learned ageing pattern

论文:(2015) Deeply-learned feature for age estimation

简述:MORPH和FG-NET数据库获得的MAE值分别为4.77和4.26。

 

5.4  CNN by Gil Levi

论文: (2015) Age and gender classification using convolutional neural networks

地址:http://ieeexplore.ieee.org/document/7301352/

图片

简述:Levi和Hassner(2015)通过使用Adience基准图像证明了卷积神经网络(CNN)在年龄和性别估计方面的更好性能。作者报告了年龄和性别的平均准确度±标准误差,并给出了年龄分类的混淆矩阵。采用单一作物的年龄估计方法的准确精度为49.5±4.4,1次精度为84.6±1.7。然而,使用过样本的拟议方法的年龄估计结果显示精确精度为50.7±5.1,1-OFF精度为84.7±2.2。

 

5.5  Deep convnets along with transfer learning strategy

论文:(2015) Automatic age estimation based on deep learning algorithm

简述:Dong等人使用最广泛使用的“Images of Groups of people”数据集,使用深层CNN和迁移学习的概念进行年龄估计。以错误率、精确匹配正确率(AEM)、年龄类别误差(AEO)和混淆矩阵作为评价参数。提出的单机型AEM为54%,AEO为90%。对于所提议的多型号,AEM为56%,AEO为92%。

 

5.6  CNN model by Ivan Huerta et al

论文:(2015) A deep analysis on age estimation

简述:这篇研究论文中使用了融合的应用来实现年龄估计。对MORPH和FRGC两个大型数据库进行了实验分析。结果达到了预期值。首先,通过人脸检测和人脸对齐对人脸进行预处理。在这些处理过的人脸图像之后,使用方向梯度直方图(HOG)、局部二值模式(LBP)、加速鲁棒特征(SURF)和融合进行特征提取。最后,使用典型相关分析(CCA)进行分类,从而估计年龄。选择MAE、累积分数、学习率和权重衰减作为评价指标。MORPH-II数据库中的年龄估计结果的MAE为4.25,累积得分为71.17%,FRGC数据库中的年龄估计结果的MAE为4.17,累积得分为76.24%。

 

5.7  Deep label distribution learning

论文:(2015) Deep label distribution learning for apparent age estimation.

地址:http://ieeexplore.ieee.org/document/7406402/citations

图片

图片

简述:Yang等人在本研究工作中研究了表观年龄估计。当每个图像由多个个体标记时,年龄值的不确定性问题就存在了。作者试图通过使用基于分布的损失函数的深度卷积神经网络(deep-CNN)来解决这个问题。该模型解决了人工年龄标注带来的不确定性问题,并报告了比其他先前设计的年龄估计模型更好的性能。实验的第一阶段分为三个步骤。这三个步骤是对MORPH-II数据集进行微调,对Adience和FG-NET等其他两个公开的面部数据集进行微调,并对竞争数据集进行微调。在这两个深度CNN模型中分别使用了KL散度损失函数和SoftMax损失函数。从这四个CNN模型中创建了一个集合结果。在实验的第二步,作者提出了一种新的CNN架构。除了输入和输出层之外,该体系结构由七个不同的层组 。最后,这两个阶段的输出根据情况融合在一起。这种情况被视为这两个阶段结果之间11年的差异。如果两个阶段的结果在这个差值范围内,则将其平均值作为最终输出,如果不在这个差值范围内,则将第一阶段的结果作为最终结果。第一阶段、第二阶段和融合后的验证集结果分别为0.3534、0.3610和0.3377。

 

5.8  Age‑Net

论文:(2015) AgeNet: deeply learned regressor and classifier for robust apparent age estimation.

地址:http://ieeexplore.ieee.org/document/7406391

图片

简述:Liu等人采用了回归和分类模型的分数融合来解决年龄估计问题。MAE为3.3345,MNE为0.2872。与其他策略相比,性能有所提高,作者提出了一个想法,使用MORPHII和FG-NET数据库,使用年龄分类器和年龄回归器共同学习框架。

 

5.9  Fine‑tuned CNN based on VGG‑16

论文:(2016) Apparent age estimation using ensemble of deep learning models

地址:http://arxiv.org/pdf/1606.02909

图片

简述:作者开发了一个集合模型,其中训练了多个CNN模型。这些多个CNN模型针对所有不同年龄组及其年龄变化组进行训练,最终组合在一起以实现更好的效率。整个工作在IMDB-WIKI数据集和ChaLearn LAP 2016挑战数据集上进行了测试。

 

5.10  Deep age distribution learning

论文:(2016) Deep age distribution learning for apparent age estimation

地址:http://ieeexplore.ieee.org/document/7789585

图片

简述:年龄估计有两种类型:按时间顺序的年龄估计和表观年龄估计。表观年龄与实际年代学年龄的决定方式不同。每个人脸图像的标签由许多人完 ,所有年龄的值被视为正确的年龄,标准偏差被用来预测这个年龄的不确定性。所使用的算法称为深度年龄分布学习(DADL)。VGGFace用于深度卷积神经网络(DCNN)的预训练和年龄数据集的微调。作者采用了人脸图像的高斯年龄分布作为训练集,而不是单一年龄。这种高斯年龄分布是根据平均年龄和标准偏差创建的。用于评估的数据集包括IMDB-WIKI数据集、ICCV ChaLearn关注人物研讨会2015和2016数据集。

图片

 

5.11  Cascaded CNN

论文:(2016) A cascaded convolutional neural network for age estimation of unconstrained faces

地址:http://ieeexplore.ieee.org/document/7791154

图片

简述:使用建议的级联CNN进行年龄估计是为了处理Adience数据集、FG-NET数据集和ICCV 2015 Challern challenge数据集的无约束人脸图像。采用的方法分三个阶段完 。在第一阶段,使用年龄组分类器将人脸图像分类为一个年龄范围。在第二阶段,通过计算每个年龄组的平均值预测的相对年龄来估计表观年龄。这是使用表观年龄回归器完 的。在最后阶段,遵循年龄误差校正策略来校正任何预测的年龄误差。实验表明,高斯误差为0.297,精确精度为52.88±6,1-OFF 精度为88.45±2.2。

 

5.12  Compact CNN

论文:(2016) Video system for human attribute analysis using compact convolutional neural network.

地址:http://ieeexplore.ieee.org/document/7532424/

图片

简述:Yi Yang等人(2016)提出了一种新的紧凑型CNN视频属性分析模型。视频属性分析旨在分析视频系统中的年龄、性别和种族等软生物特征。回归层用于回归任务,或者N-way SoftMax层用于分类任务。在Morph II数据库上测试时,与其他最先进的方法相比,该模型的MAE为3.23年,准确率为98.82%。这个紧凑的CNN模型展示了它在真实环境中基于人类属性分析的鲁棒性视频系统。

图片

 

5.13  CNN for age estimation with age difference

论文:(2016) Facial age estimation with age difference

地址:http://ieeexplore.ieee.org/document/7762921/

图片

简述:Hu等人(2016年)提出了一种深度卷积神经网络模型(DCNN),该模型有助于估计未标记或弱标记训练图像(如社交媒体平台中的图像)的年龄。年龄差异可以从同一个人的两张照片中计算出来。该CNN首先设计用于带有年龄标签的年龄数据集,然后最终改进为用于嵌入年龄信息的无标签老化数据集算法,即Kullback–Leibler(K–L)散度算法。在SoftMax层的顶部设计了三种损耗函数。这些损失函数被称为熵损失、交叉熵损失和Kullback–Leibler(K–L)散度损失。CNN模型试图从这些损失函数的组合中解释正确的年龄范围。正确的年龄范围由年龄等级概率分布的单峰值来标记。该模型已在实时环境中证明了其优势,可以 功地对任意年龄、任意种族和任意姿势的人脸图像进行年龄估计。

图片

所有测试都是在FG-NET、MORPH和标有年份的LFW(Huang et al.2007)数据集上进行的。作者们还开发了一个数据集,其中包含大约10万张脸的图像,这些图像标有点击日期。每个人脸图像都标有人物身份和时间戳。累积分数和平均绝对分数用作评估指标。作者们的目标是在未来为同样的任务开发其他软生物特征,如步态、身高和发型。FG-NET数据库的MAE为2.8,MORPH数据库的MAE为2.78。与kNN、SVR和SVM相比,该方法的累积曲线显示出了更好的结果。

 

5.14  Multiple output CNN

论文: (2016) Ordinal regression with multiple output CNN for age estimation

地址:http://ieeexplore.ieee.org/document/7780901

图片

简述:牛振兴等(2016)开发的多输出卷积神经网络(CNN)可用于解决多个分类子问题。这些多重二元分类子问题是由一个有序回归问题得到的。在MORPH和AFAD上,这项新工作的表现都达到了预期。生物启发特征(BIF)用于特征提取任务。使用平均绝对误差(MAE)度量在MORPH II和AFAD数据集上报告了度量回归和顺序回归的比较。MAE值在MORPH-II数据库中为3.27,在AFAD数据库中为3.34。

 

5.15  Ranking CNN

论文: (2017) Using ranking-CNN for age estimation.

地址:http://ieeexplore.ieee.org/document/8099569/

图片

简述:该框架为输入图像设计一系列年龄组子网络,最终将所有这些子网络的二进制输出组合在一起,得到用于年龄预测的最终年龄标签。所有年龄组的特征都是独立学习的。这将导致不同的老化模式和优化的性能。过度拟合被减少,因为标签数据被用来单独训练每个分离的年龄组。此外,作者还提供了更严格的年龄排序误差范围。此错误界限是分类器生 的所有单个错误的总和。CNN排名的性能优于之前的方法,并且显示出较少的估计误差。作者在研究论文中证明了三个定义良好的定理。定理一指出,最大二元误差的最小化可以减少最终的排序误差。第二个定理是CNN和SoftMax之间的顺序关系。第三个定理是一个定义良好的上界定义的预期误差排名。在MORPH II数据集上进行了实验,获得了准确度、MAE、累积分数和T集结果。对CNN的排名,L=6的准确率为89.90%,L=7的准确率为92.93%。其MAE值达到2.96。

 

5.16  D2C for age estimation

论文:(2017) D2C: deep cumulatively and comparatively learning for human age estimation

地址:

http://www.researchgate.net/publication/312150764_D2C_Deep_cumulatively_and_comparatively_learning_for_human_age_estimation

图片

简述:作者通过引入两个新的可微层,开发了一个用于年龄估计的端到端可训练模型。这两层是累积隐藏层和比较排名层。累积隐藏层通过提供逐点累积信号来减少样本不平衡的问题。通过这种方式,该模型可以从相邻年龄的人脸中间接了解一个人的年龄。此外,比较排名层有助于年龄特征学习。该层提供 对比较信号,以提取与年龄相关的特征。为了充分利用有限的训练数据,作者对在各种训练对中包含一张脸表示赞赏。作者保证了他们工作的新颖性,并在两个名为Morph 2数据库和WebFace数据库的基准数据库上测试了性能。平均绝对误差(MAE)用于分析两层的新颖性。通过与一些最先进的方法的比较,验证了D2C体系结构的优越性。将来还可以使用其他一些更深层次的网络来进一步提高性能。与D2C架构相关的损失包括年龄损失、累积损失和等级损失。作者详细说明了这些损失。通过与各种先进方法的比较,该模型在Morph II数据集上的MAE为3.06,在WebFace数据集上的MAE为6.04。

 

5.17  Jointly fine‑tuned DNN

论文:(2017) Age and gender classification from speech and face images by jointly fine-tuned deep neural networks.

地址:

http://www.researchgate.net/publication/316970285_Age_and_Gender_Classification_from_Speech_and_Face_Images_by_Jointly_Fine-Tuned_Deep_Neural_Networks

图片

简述:作者同时设计和训练了两个深度神经网络(DNN),然后将它们连接起来并进行微调,以实现年龄和性别分类。作者使用了言语和无约束的人脸图像来达到目标结果。结果从各个方面验证了所提出的代价函数(sigmoid函数和SoftMax函数)的有效性。在aGender数据库和Adience数据库上获得的总体准确度值分别为56.06%和62.37%。

 

5.18  CNN for age estimation in wild

论文:(2017) Age and gender recognition in the wild with deep attention.

地址:

https://www.researchgate.net/profile/Jordi-Gonzalez-3/publication/318084198_Age_and_Gender_Recognition_in_the_Wild_with_Deep_Attention/links/59e9fec9a6fdccef8b08c66b/Age-and-Gender-Recognition-in-the-Wild-with-Deep-Attention.pdf

图片

简述:Rodriguez等人(2017年)提出了一个新的基于CNN的模型,用于在不受控制的环境中,在分心、杂乱、遮挡和变形的情况下进行年龄和性别识别。CNN对人脸图像的变化非常敏感,因此其准确性仍远未达到最佳结果。Rodriguez等人(2017年)开发的模型证明,与迄今为止设计的其他最先进模型相比,该模型具有更好的准确性和鲁棒性,相对改进率为4.47%。作者通过前馈机制识别出最具辨别力的低分辨率斑块,并最终将其转换为高分辨率。此外,该方法对噪声和干扰具有很强的鲁棒性,因为它更重视图像的变形部分和最不受遮挡的部分。该模型不仅适用于Adience和Images of Group(IOG)等非受控人脸图像数据库,而且适用于Morph II等受控人脸图像数据库。该模型由三个主要模块组 :注意力CNN、补丁CNN和多层感知机(MLP)。首先,所有的训练图像被传递到注意力CNN,CNN预测最佳注意力网格。其次,从最佳注意网格中识别出的高分辨率面片被进一步输入到面片CNN。最后,将注意力CNN和补丁CNN中的部分特征输入分类器,利用MLP进行分类。所有实验均采用VGG16 CNN结构,并使用TensorFlow实现。根据准确率百分比和平均绝对误差(MAE)进行性能评估。作者还报告了不同设计决策对拟议研究工作的影响,如注意模式、权重共享、合并模式、注意网格和斑块深度。在没有注意模型的Adience数据集上,准确度值为57.8±4.9,有注意的Adience数据集准确度值为61.8±2.1。在群体数据集的图像上,注意模式的准确度值变为60%,MAE为2.56。

 

5.19  Convolutional neural network (CNN)–extreme learning machine (ELM)

论文:(2018) A hybrid deep learning CNN–ELM for age and gender classification.

地址:

http://www.cs.newpaltz.edu/~lik/publications/Mingxing-Duan-NC-2017.pdf

简述:作者将卷积神经网络(CNN)和极限学习机(ELM)的能量结合起来进行年龄估计和性别分类。特征提取使用CNN进行,ELM用于结果分类。作者还提供了有关参数选择和层设计的详细信息,为防止过度拟合而采取的措施,以及反向传播过程的详细推导。

图片

图片

CNN-ELM混合结构的设计合理地安排了卷积层、对比度归一化层、最大池层和ELM分类层。卷积层与之前的层进行卷积,从而提取感兴趣的特征。对比度归一化层允许使用减法和除法运算在同一空间位置计算不同的特征地图。最大池层丢弃所有无关信息,只保留重要信息。最后,将全连接层的输出作为输入连接到ELM,并执行分类任务。CNN-ELM的处理作为训练阶段和分类阶段进行。错误率、准确度、年龄和性别错误分类是用于从最先进的方法证明该体系结构具有更好性能的参数。对于年龄分类,准确率为52.3%,MAE为3.44。

 

5.20  CNN based five cascaded structures

论文:(2018) Auxiliary demographic information assisted age estimation with cascaded structure

地址:

http://www.cbsr.ia.ac.cn/users/jwan/papers/TCYB2017_age.pdf

图片

简述:Wan等人(2018年)提出了五个级联结构的框架,使用性别和种族信息预测一个人的年龄。这些如此探索的框架被命名为Gender2AgeNet、GenderRace2AgeNet、RaceGender2AgeNet、Race2AgeNet和Age2AgeNet。这些级联框架的一个特点是,它们不仅可以估计一个人的年龄,还可以用于年龄和性别分类。特征提取后,使用高斯过程回归(GPR)代替线性回归进行年龄估计。作者使用MORPH II、CACD和验证集ChaLearn数据库来计算拟议工作的结果。平均绝对误差(MAE)、累积分数(CS)和运行时分析是作者报告的评估标准。结果表明,在Morph II数据库上测试时,浅网的平均MAE为3.11,深网的平均MAE为2.93。累积得分结果显示不同的值,如2个网络42.54分,4个网络71.12分,6个网络87.07分,8个网络94.65分,10个网络97.82分。CACD数据库将MAE值达到了5.24。

 

5.21  Deep residual CNN

论文: (2018) Age estimation robust to optical and motion blurring by deep residual CNN.

地址:https://www.mdpi.com/2073-8994/10/4/108/pdf

图片

简述:Kang等人(2018年)通过开发一种新型的深层ResNet-152 CNN架构,为实时人脸图像的光学和运动模糊问题提供了解决方案。所有的特征向量系数和分类器权重都是自动训练的,无需任何人工干预。整个算法包括使用Adaboost算法检测人脸和眼睛区域,在感兴趣区域(ROI)中对人脸图像进行重新定义和平面内旋转,最后,使用预先训练的ResNet-152 CNN来估计人的最终年龄。作者在PAL数据库和Morph数据库上测试了所提出的工作。PAL数据库图像的MAE为6.0,Morph数据库图像的MAE为5.78。

图片

 

5.22  Autoencoders

论文:(2018) Age estimation using deep learning.

地址:

https://sciencedirect.53yu.com/science/article/pii/S0045790617334298

图片

简述:Zaghbani等人(2018年)试验了基于自动编码器的年龄估计。自动编码器是一种人工神经网络,用于系统的无监督学习。其体系结构包括输入层、一个或多个隐藏层和输出层。作者提出了一种用于人类年龄估计的深度监督稀疏自动编码器。拟议工作分两个主要阶段进行说明。使用Adaboost算法提取和裁剪人脸图像,并使用tan逆公式对这些提取的人脸进行平面内旋转。第一阶段报告数据准备、面部检测和头部平面内旋转。第二阶段探索基于深度监督稀疏自动编码器(DSSAE)的分类任务。这些自动编码器处理隐藏的神经元和输入输出神经元,使其具有相同的激活概率。首先,数据被压缩以达到这个条件。然后检查数据的相关性,并根据这种相关性进行分类。作者给出了使用的参数、使用的数据集(MORPH和FG-NET)、MAE与最先进方法的比较、基于年龄组的MAE结果、累积评分结果、DSSAE和去噪堆叠式自动编码器(DSAE)之间的比较,以及基于KNN和WN分类器的MAE结果的比较。在FG-NET数据库上,MAE为3.75,在MORPH数据库上,MAE为3.34,这比其他最先进的方法要低得多。该算法基于有监督的预训练方法,其性能优于任何其他无监督方法。

 

5.23  Conditional multitask (CMT) learning

论文:(2018) Deep facial age estimation using conditional multitask learning with weak label expansion.

地址:https://ieeexplore.ieee.org/abstract/document/8329236/

图片

简述:条件多任务(CMT)学习是一种基于深度学习的统一架构,它基于性别预测来估计一个人的实际年龄。ByungIn Yoo等人(2018年)在2018年6月设计了这样一个模型,并在其中加入了弱标签扩展。弱标签扩展实际上意味着将分类年龄组标签转换为离散年龄值标签。作者还导出了一个平均图像,作为统一深度体系结构的测试输入。所有实验均在MORPH-II(Ricanek和Tesafaye 2006)和FG-NET(Panis等人,2016)数据库上进行。比较包括单任务、多任务和CMT学习之间的区别、定性分析、不同CNN架构之间的比较以及之前方法之间的比较。该方法优于所有最新的年龄估计模型。在CASIA WebFace数据集上,我们提出的方法实现了五重交叉验证协议的MAE为3.04,两重交叉验证协议的MAE为3.08。在FG-NET数据库上,我们的基线方法实现了3.46的MAE。在Morph II数据库上,我们提出的方法实现了五倍交叉验证协议的MAE为2.89,两倍交叉验证协议的MAE为2.91。

图片

 

5.24  CNN for ocular images from smart phones

论文:(2018) Convolutional neural networks for age classification from smart-phone based ocular images

地址:https://ieeexplore.ieee.org/abstract/document/8272766/

图片

简述:Ajita Rattani等人(2018年)提出了一种新的卷积神经网络(CNN)模型,可以从眼部图像中对年龄进行分类。年龄分类和眼部图像识别可以结合起来提高系统的性能。该CNN是一个六层模型,由3个卷积层和最大池层、一个扁平层和两个完全连接的层组 。总共涉及41416个参数。得到的结果与使用全脸图像得到的结果具有可比性。当没有完整的面部图像时,这项研究是有益的。五倍交叉验证的准确度和一次准确度分别为46.97±2.9%和80.96±1.09%。

图片

 

5.25  DAG‑CNN

论文:(2018) Multi-stage age estimation using two level fusions of handcrafted and learned features on facial images.

地址:https://ieeexplore.ieee.org/document/8646731/

图片

简述:Taheri和Toygar(2018)利用了GoogLeNet CNN和VGG-16 CNN不同层次的多阶段特征。作者提出了一种新的CNN结构,称为有向无环图卷积神经网络(DAG-CNN)。该模型自动学习来自GoogLeNet或VGG16模型各层的鉴别特征,并使用分数级融合将这些特征组合在一起。设计了两种不同的架构。一个使用GoogLeNet CNN作为主干结构,即DAG-GoogLeNet,另一个使用VGG-16作为主干结构,即DAG-VGG16。所有实验均在FG-NET和MORPH-II数据库上进行了测试。从主干结构的中间层出来的所有分支分别传递到平均池层、规范化层和完全连接的MLP层。最后一层神经元的数量与年龄层的数量相同。使用分数级融合将所有单个分数向量融合在一起,最后在决策层估计年龄。对DAG-GoogLeNet模型的实验分析表明,在MORPH-II和FG-NET数据库上,MAE分别为2.87和3.05。然而,对DAG-VGG16模型的实验分析表明,在MORPH-II上的MAE为2.81,在FG-NET数据库上的MAE为3.08

 

5.26  CNN for fusion based multi‑stage age estimation

论文: (2019) On the use of DAG-CNN architecture for age estimation with multi-stage features fusion.

地址:

https://sciencedirect.53yu.com/science/article/pii/S0925231218313110

图片

简述:Shahram Taheri和Onsen Toygar(2019)设计的CNN模型分别结合了MORPH-II和FG-NET数据库中人脸图像的多阶段学习特征和手工特征。这个模型包括两种方法。第一种方法包括从卷积神经网络的多层学习的特征向量的分数级融合。第二种方法包括各种局部手工特征的特征级融合,包括皮肤、皱纹和其他一些生物特征(BIF)。在应用特征级融合之前,所有这些手工制作的特征描述符都使用Z-score进行规范化。通过与AgeDB数据库上的结果进行比较,验证了结果。提出的方法在MORPHII数据库和FG-NET数据库上的MAE值分别为3.17和3.29。作者证明了这样一个事实,即他们提出的方法在MAE和CS曲线方面都比其他最先进的方法更有效。

图片

 

6. Some other facial age estimation methods

除了上述研究人员提出的用于面部年龄估计的不同神经网络模型外,还有许多其他用于年龄估计的分类、回归和混合方法。下文简要总结了所有这些不同的年龄估计方法,以便更好地了解感兴趣的研究人员。所有这些方法的细节可能有助于读者更好、更广泛地理解。通过这种方式,可以清楚地解释每种年龄估计方法的意义,这可能有助于调查面部年龄估计的更好选择。

 

7. 基于神经网络的面部年龄估计的最新进展比较

下表总结了基于神经网络的面部年龄估计的26项最新进展。该表从参考编号、出现年份、使用的模型、数据集、主要贡献、评估指标和结果讨论等方面对本文分析的所有算法进行了比较。从2010年到2019年,所有26项研究工作都按时间顺序排列在表格中。本文分析的大多数研究工作都基于卷积神经网络(CNN),因为CNN适用于图像、视频和任何其他2D/3D信息等数据。

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

8. 讨论和总结

8.1 性能评价指标分析

图片

其中,

图片

图片

 

8.2 不同数据库使用频率比较

图片

 

8.3 在MORPH-2数据库上测试不同年龄估计方法的MAE结果

图片

 

8.4 在FG-NET数据库上测试不同年龄估计方法的MAE结果

图片

8.5 ADIENCE数据库上不同年龄估计方法的准确度结果

精确准确度是当训练模型确定受试者所属的确切组时计算的准确度。1-OFF准确度是指当训练模型在准确预测组之前或之后识别组时计算的准确度。

图片

8.6 在ChaLearn LAP 2015和ChaLearn LAP 2016数据库上测试了不同年龄估计方法的MAE结果

图片

 

8.7 在IMDB和IoG数据库上测试了不同年龄估计方法的MAE结果

图片

 

总结:

 

综述总结了近年来一些神经网络对年龄估计任务所做的贡献。不同的研究人员提出了很多不同类型的convnet。有些只介绍了年龄估计,有些同时实现人脸识别或性别分类与年龄估计。此外,一些文献的特征提取和分类仅使用单个特征提取器或单个分类器,而在其他一些文献中,采用多特征融合来执行特征提取或分类任务。年龄估计作为软生物识别任务中少有的发展较快的分支,对年龄估计任务的研究,有利于向其他相关任务迁移,有利于促进整个软生物识别技术的发展。