数据集

一、常见目标检测数据集

1、PASCAL VOC 07/12

Pascal Visual Object Classes（VOC）挑战赛。对四个目标类别进行分类和检测。这两个版本主要用于基准测试集。VOC2007 有5k个训练图像，超过12k的标注目标；VOC2012有11k个训练图像，超过27k个标注目标，目标类别扩展到了20类，增加了语义分割、动作识别的任务。Pascal VOC引入了mAP@0.5IoU作为评价指标评估模型性能。

2、ILSVRC

ImageNet Large Scale Visual Recognition Challenge。用作评估模型性能的基准集。数据集包含1000个类别、超过100万个图像，其中精选了200个类别、超过500k个图像被于目标检测。

3、MS-COCO

The Microsoft Common Objects in Context。COCO数据集是目前最具挑战的数据集之一，包含了自然环境中发现的、四岁儿童可识别的91种常见目标。包含了超过200万个实例，且平均每张图像中有3.5个类别、7.7个实例，也包括了多种视角的图像。COCO在IoU从0.5到0.95的范围内每隔0.5计算一次mAP，然后平均这十个mAP，得到AP。除此之外，它还将AP分别用于小型、中型和大型对象，以在不同的尺度上比较性能。

注：mAp（mean Average Precision），均值平均精度。

mAp = 所有类别的平均精度求和 / 类别总数

AP（Average Precision）平均精确度