【摘要】:KITTI数据集包含在市区、乡村和高速公路等场景采集的真实图像数据,每张图像最多含有15辆车和30个行人,图像中的目标存在不同程度的遮挡与截断。图7.16~图7.19是KITTI数据集示例,分别表示带有传感器的记录平台、视觉里程基准轨迹、视差和光流图和用于目标检测任务的3D物体的标注。
KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合构建,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集,可用于评测立体匹配、光流、视觉测距(visual odometry)、3D物体检测和3D跟踪等计算机视觉技术在车载环境下的性能。KITTI数据集包含在市区、乡村和高速公路等场景采集的真实图像数据,每张图像最多含有15辆车和30个行人,图像中的目标存在不同程度的遮挡与截断。整个数据集由389个立体光流图像对、39.2 km视觉里程测距序列以及在嘈杂场景中捕获的超过200 000个的三维物体图像标注组成。总体上看,原始数据集被分为五大类:公路、城市、住宅区、校园和人。对于3D物体检测,标签类别细分为小轿车、面包车、卡车、行人、坐着的行人、骑行人、电车以及杂项。图7.16~图7.19是KITTI数据集示例,分别表示带有传感器的记录平台、视觉里程基准轨迹、视差和光流图和用于目标检测任务的3D物体的标注。
图7.16 KITTI数据收集所使用的带有传感器的记录平台示例[28]
图7.17 KITTI数据集中的视觉里程基准轨迹示例[28](www.daowen.com)
图7.18 KITTI数据集中的视差和光流图示例[28]
图7.19 KITTI数据集中的3D物体标注示例[28]
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关迁移学习基础及应用的文章