常见目标检测数据集

发布时间 2023-11-06 16:33:21作者: 同淋雪

数据集

一、常见目标检测数据集

1、PASCAL VOC 07/12

Pascal Visual Object Classes(VOC)挑战赛。对四个目标类别进行分类和检测。这两个版本主要用于基准测试集。VOC2007 有5k个训练图像,超过12k的标注目标;VOC2012有11k个训练图像,超过27k个标注目标,目标类别扩展到了20类,增加了语义分割、动作识别的任务。Pascal VOC引入了mAP@0.5IoU作为评价指标评估模型性能。

2、ILSVRC

ImageNet Large Scale Visual Recognition Challenge。用作评估模型性能的基准集。数据集包含1000个类别、超过100万个图像,其中精选了200个类别、超过500k个图像被于目标检测。

3、MS-COCO

The Microsoft Common Objects in Context。COCO数据集是目前最具挑战的数据集之一,包含了自然环境中发现的、四岁儿童可识别的91种常见目标。包含了超过200万个实例,且平均每张图像中有3.5个类别、7.7个实例,也包括了多种视角的图像。COCO在IoU从0.5到0.95的范围内每隔0.5计算一次mAP,然后平均这十个mAP,得到AP。除此之外,它还将AP分别用于小型、中型和大型对象,以在不同的尺度上比较性能。

:mAp(mean Average Precision),均值平均精度。

​ mAp = 所有类别的平均精度求和 / 类别总数

​ AP(Average Precision)平均精确度

4、Open Image

谷歌提供的数据集,由920万张图像组成。使用图像级标签、对象边界框和分割掩码等进行标注。对于目标检测,Open Image有1600万个包围框,包含190万张图像上的600个类别,每张图像有8.3个对象类别。

二、数据倾斜/偏差问题

图3和图6中,不同类别的图片数量差别很大。在Pascal VOC、MS-COCO、Open Image数据集中,除了前五类,后面类的图片数量显著下降。这种现象表示了数据集的一种倾斜,这必然会在任何目标检测模型的训练过程中产生一种偏差。

因此,在这些倾斜数据集上训练的目标检测模型,对于训练数据中数量较多的类,可能表现出更好的检测性能。

三、评价指标

True positive —— 预测正确,且为正样本

False positive —— 错误的预测成正样本

True negative —— 预测正确,且为负样本

False negative —— 错误的预测成负样本

image-20230323130225849

AP (average precision):每一类的平均精度;

mAP:将所有类的AP求平均值。