理论教育 PASCALVOC数据集介绍

PASCALVOC数据集介绍

时间:2023-07-01 理论教育 版权反馈
【摘要】:PASCAL VOC数据集是一个集Flickr网站图片、真值标签和标准评价软件于一身的数据集。从2007年到2012年间,PASCAL VOC数据集的图像识别比赛每年都会举办一次。PASCAL VOC数据集的目标是评估算法在真实自然环境下的性能。图7.10PASCAL VOC数据集类别概况[25](见彩插)目前PASCAL VOC数据集也成为评价目标检测方法的基准数据集之一。表7.1显示了PASCAL VOC 2007和PASCAL VOC 2012的训练集、验证集和测试集的划分情况。表7.1PASCAL VOC数据集统计单位:张

PASCALVOC数据集介绍

PASCAL VOC数据集是一个集Flickr网站图片、真值标签和标准评价软件于一身的数据集。它包含5个具有挑战性的任务,分别为图片分类、目标检测、目标分割(object segmentation)、动作识别和人体轮廓布局任务。从2007年到2012年间,PASCAL VOC数据集的图像识别比赛每年都会举办一次。创建PASCAL VOC数据集和举办比赛的原因主要有两点,第一是为目标检测和识别等方法提供具有挑战性的图像、高质量的标注和标准的评价方法,用来客观地比较各种方法的性能;第二是展现每年在检测、识别等视觉领域中先进方法的性能水平。PASCAL VOC数据集的目标是评估算法在真实自然环境下的性能。这就需要PASCAL VOC数据集包含各种自然场景中的目标图像,在尺度、方向、姿势、光照、位置和遮挡上都具有明显的变化。图7.9为PASCAL VOC数据集中的一些图像示例,从中可以看出,每个类别的类内变化都比较大。

图7.9 PASCAL VOC数据集中的一些图像示例[25]

起初PASCAL VOC数据集并不像现在这样完善和全面。在2005年,该数据集只提供了四个种类的图像:自行车汽车摩托车和人。一共有1 578张图像,包含2 209个具有边界框标注的目标。在2006年,其增加到10个类别,有2 618张图像,包含4 754个具有边界框标注的目标。这些图像来自Flickr网站和Microsoft Research Cambridge(MSRC)数据集。2007年,其增加到20个类别,一共包含9 963张图像和24 640个具有边界框标注的目标。2010年,数据集加入了动作识别数据样本。测试图像的数量由起初的1 578张增加到了2007年高峰时期的9 963张,随后的一年则出现了大幅下降,直到2010年图库数量重新达到高峰,并在2011年稳定在11 530张。PASCAL VOC数据集的图像都是通过多个关键词从Flickr网站检索得到的,涵盖20个目标类别,大致可以分为四大类:车辆、动物家居物品和人,如图7.10所示。PASCAL VOC挑战赛在2012年后便不再举办,但由于其图像质量好、标注完备,许多计算机视觉算法将在PASCAL VOC数据集上的性能作为评价该算法的重要依据。

图7.10 PASCAL VOC数据集类别概况[25](见彩插)(www.daowen.com)

目前PASCAL VOC数据集也成为评价目标检测方法的基准数据集之一。对于目标检测任务,通常使用的数据集有PASCAL VOC 2007和PASCAL VOC 2012。表7.1显示了PASCAL VOC 2007和PASCAL VOC 2012的训练集、验证集和测试集的划分情况。

表7.1 PASCAL VOC数据集统计 单位:张

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈