SVHN是一个真实世界的图像数据集,用于开发机器学习和对象识别算法,对数据预处理和格式化的要求最低。它可以被视为与MNIST风格相似(例如,图像是经过裁剪的小数字),但包含一个数量级的更多标记数据(超过600,000个数字图像),并且来自一个更难、未解决的现实世界问题(识别自然场景图像中的数字和数字)。SVHN是从谷歌街景图像中的门牌号获得的。
该数据集的目的是提供一种简单的方法来开始处理3D计算机视觉问题,例如3D形状识别。
MediaTeamOuluDocument数据集是一个文档扫描图像和文档内容数据集,包含500篇1975年之前的文档信息。
CAT数据集包括超过9,000张猫图像。对于每张图像,猫的头部都有九个点的注释,眼睛两个,嘴巴一个,耳朵六个。
StreetScenesChallengeFramework是用于对象检测的图像、注释、软件和性能测量的集合。每张图像都是从马萨诸塞州波士顿及其周边地区的DSC-F717相机拍摄的。然后用围绕9个对象类别的每个示例的多边形手动标记每个图像,包括[汽车、行人、自行车、建筑物、树木、天空、道路、人行道和商店]。这些图像的标记是在仔细检查下完成的,以确保对象总是以相同的方式标记,关于遮挡和其他常见的图像变换。
从Internet(例如YouTube或Google)上的图像/视频收集的四个小物体数据集,包括4种类型的图像,可用于小物体目标检测的研究。
数据集包含四类:
斯坦福狗数据集包含来自世界各地的120种狗的图像。该数据集是使用ImageNet中的图像和注释构建的,用于细粒度图像分类任务。
该数据集的内容:
野生图像数据集中的标记鱼类由NOAAFisheries(国家海洋渔业服务局)提供,以鼓励对无约束水下图像的自动图像分析算法进行开发、测试和性能评估。
该数据集包括鱼类、无脊椎动物和海床的图像,这些图像是使用部署在远程操作车辆(ROV)上的摄像系统收集的,用于渔业调查。
Cars数据集包含196类汽车的16,185张图像。数据分为8,144个训练图像和8,041个测试图像,其中每个类别大致按50-50分割。课程通常在品牌、型号、年份级别,例如2012TeslaModelS或2012BMWM3coupe。