portant;">众所周知,自动驾驶的发展和人工智能技术进步密不可分,数据、算力和算法作为人工智能的三要素显著影响着自动驾驶技术的成熟度,而在这三要素中,数据有着举足轻重的作用。AI只有经过大量的训练,神经网络才能总结出规律,应用到新的样本上。如果现实中出现了训练集中从未有过的场景,则网络会基本处于盲猜状态,从而出现错误,因此可靠并且高质量的数据采集在自动驾驶开发过程中的作用就显得尤为重要。
portant;">为了保证采集数据的准确性,用于记录数据的车辆,需要配备满足其智能驾驶特定等级的传感器和测量技术。主要的传感器类型包括摄像头、毫米波雷达和激光雷达。系统的核心是融合控制器,它获取所有传感器的数据并实时计算当前环境模型,然后用于控制驱动、转向和制动系统。
portant;">满足各种传感器、ECU和通信数据记录的高性能数据采集系统需要专门为连续运行而设计,提供高可靠的RAID存储设备,可以测量摄像头、毫米波雷达,激光雷达原始数据,具备测试融合控制器,还包括附加的参考摄像头视频数据以及提供车辆精确位置的惯性导航系统数据和车载以太网、CAN、CANFD、FlexRay等众多总线数据。
portant;">概要图
portant;">解析数据采集过程中的关键点
portant;">1.可靠性高、同步性好、简单易用的采集设备
portant;">这些传感器从整车布置的安装结构设计、FOV校核,再到实车的装配标定,都需要保证位置准确和稳定,从而支持不同位置传感器数据可以顺利拼接。数据采集系统的设计必须机械鲁棒且适合汽车环境,具备高可靠性。其他的要求还包括温度范围符合车规级,低功耗、可靠的电源管理。一般而言,需要记录的数据类型主要由传感器决定。当然对于不同的开发应用,也需要通过采集系统输出被测传感器的特定格式数据。比如对于车载摄像头而言,通过FPD-link或者GMSL采集摄像头的原始数据,可能需要输出YUV、RAW12、以及经过H264编码的压缩视频数据。采集系统需要能够满足不同测试场景需要,提供不同类型存储。
portant;">2.确保实车采集的数据质量数据采集系统应该提供适应性强、操作友好、显示直观的用户界面,用于显示、操作和监控系统运行状态。其界面应该满足不同的场景采集快速配置,通过可视化界面展示各传感器采集数据状态。提供方便的Trigger记录,用户对记录进行标记以便在以后的数据分析中更好的利用记录数据。
portant;">需要根据传感器数据类型特征,提供各种显示窗口来获取传感器或融合数据的可视化呈现。诸如信号和跟踪窗口、鸟瞰图的目标展示、目标叠加视频显示、GPS地图显示和激光雷达点云展示等。
portant;">实车采集过程中,需要尽可能覆盖各种用户场景。一般来说,道路状态、交通信号和标识、各类车辆和行人目标、天气环境等,都是影响智能驾驶的关键因素,路试采集场景需要涵盖城市、乡村、高速、隧道以及白天和夜晚等,以确保尽可能覆盖用户各种实际场景。
portant;">3.海量数据的存储及转移
portant;">不同等级阶段的车辆,需要采集的数据量也呈现几何级增长。以目前常见的L3阶段为例,随着4K超高清摄像头、128线激光雷达等传感器引入,每天8小时数据采集系统记录的数据量高达30TB。
portant;">采集系统需要提供高带宽、高容量的数据存储,同时还需要考虑如何将数据简便的方式将数据传输到数据中心。比如通过专门的数据上传机将数据传输到容量为PB级别的数据中心。
portant;">4.采集过程中的车队监控管理
portant;">采集结束后的数据使用通过数据采集系统,可将自动驾驶车辆各类传感器类型的数据进行采集处理,包括常见的CAN、CANFD、ETH车载以太网数据等。用户可以通过数据中心访问数据,进行后续数据分析、数据标注、数据回注等,从而形成完整的数据闭环。