(BEV综述)DelvingintotheDevilsofBird’seyeviewPerception:AReview,EvaluationandRecipe哈哈哈喽喽喽

自驾特征融合背景:自驾传感器方案由复杂的多个摄像头,激光雷达,rada等组成,而融合多个传感器输入到统一视图的表示特征至关重要BEV感知实现特征融合好处:BEV特征表示是融合好的和直观的(可以直接在规控中使用)BEV感知核心问题:

数据集、benchmark标注满足任务的评估,数据集包含高质量的2D和3DObject标注,2D和3DObject精确对齐是两个关键评估点;

包括1、任务/算法:单目相机3Dobjectdetection、基于LiDAR3Dobjectdetectionandsegmentation、相机和激光雷达融合2、数据集:KITTI、nuScenes、Waymo

在2D特征提取器中,在2D感知中存在大量的经验,这些经验可以在3D感知中以backbone预训练中使用

追溯到30年前,当时反向透视映射(IPM)提出了从3D空间到2D空间的投影;这个方法假设3D空间中的对应点位于水平面上,这样的变换矩阵可以由相机的内、外参数进行数学推导,之后一系列的工作应用IPM以预处理或后处理的方式将元素从透视视图转换为鸟瞰视图,

由于三维空间中的体素稀疏且不规则,应用三维卷积是低效的。对于工业应用,可能不支持3D卷积等运算符;需要合适且高效的3D检测网络。MV3D是将点云数据转换为BEV表示的第一种方法,在点离散化为BEV网格后,根据网格中点获得高度、强度和密度特征用于表示网格特征;由于BEV网格有许多点,因此在这一处理过程中,信息损失相当大。不少方法遵循类似模式,用BEV网格中的统计数据表示点云,例如最大高度和强度平均值。PointPillars首先介绍了Pillar的概念,这是一种特殊类型的无限高度体素。它使用简化版本的PointNet来学习Pillar的点表示,然后编码特征可以由标准2D卷积网络和检测头处理,虽然PointPilllars的性能不如其他3D主干,但它及其变型效率高,因此适合工业应用。

有两个同名的BEVFusion模型从不同的方向探索BEV的融合;由于摄像机到激光雷达的投影会丢掉摄像机特征的语义密度,MIT的BEVFusion设计了一种高效的摄像机到BEV的转换方法,该方法可以有效地将摄像机特征投影到BEV中,然后使用卷积层将其与激光雷达BEV特征融合。北大和阿里实验室的BEVFusion将BEV融合视为保持感知系统稳定性的鲁棒性问题,它将摄像头和激光雷达特征编码到同一BEV中,以确保摄像头流和激光传感器流的独立性,这种设计使感知系统能够在传感器有故障时保持稳定性。两个BEVFusion之外,UVTR对不同的输入模态的特定体素空间中,没有进行高度压缩,避免语义歧义并支持进一步的交互。每个视图的图像特征转换为预先定义的带有深度分布的空间,这样可以构建图像体素空间。点体素空间使用普通三维卷积网络构建。然后在两个体素空间之间进行跨模态交互,以增强模态特定信息。

基于BEV的感知算法支持不同的数据模式,包括相机、激光雷达、雷达、IMU和GPS。摄像机和激光雷达是自动驾驶的主要感知传感器。一些产品仅使用摄像机作为输入传感器,例如特斯拉、鉴智机器人、Mobileye。其他采用一套相机和激光雷达组合,例如地平线,毫末。请注意,IMU和GPS信号通常用于传感器融合,特斯拉和地平线等的情况也是如此

特征提取器用于将原始数据转换为适当的特征表示,该模块通常由主干和颈网组成。特征提取器作为主干和颈网有不同的组合。例如,毫末的ResNet和Tesla的RegNet可以用作图像主干。颈网可以是毫末的FPN、Tesla的BiFPN等。至于点云输入,毫末的基于pillar的选项,或Mobileye的基于体素的选项,是主干的理想选择

在行业中执行视图转换主要有四种方法:

在先前的BEV变换模块中已经完成了不同相机源之间的对准。在融合单元中,他们进一步聚合来自相机和激光雷达的BEV特征。通过这样做,来自不同模式的特征最终被集成到一个统一的形式中。

在BEV感知中,多头设计被广泛采用。由于BEV特征聚集了来自所有传感器的信息,所有3D检测结果都从BEV特征空间进行解码。同时,PV结果(对自动驾驶仍有价值)也从某些设计中对应的PV特征进行解码。预测结果可分为三类:(a)低级结果与物理约束有关,如光流、深度等。(b)实体级结果包括目标概念,即车辆检测、车道线检测等。(c)结构级结果表示目标之间的关系,包括目标跟踪、运动预测等

为了提高BEV编码器的特征质量,以下讨论三个主要方面:

(a)2D特征提取器。改善2D感知任务的主干表征质量,也最有可能改善BEV任务的表征质量。为了方便起见,在图像主干中,采用了在大多数2D感知任务中广泛使用的特征金字塔。2D特征提取器的结构设计,如最先进的图像特征提取器、全局信息交互、多级特征融合等,都有助于更好地表示BEV感知的特征。除了结构设计外,辅助任务监督主干对BEV感知性能也很重要,后面会讨论。

(b)视图转换。该变换采用图像特征并将其重新组织到BEV空间中。超参数,包括图像特征的采样范围和频率,以及BEV分辨率,对于BEV感知性能至关重要。采样范围决定图像后面的观察截锥(viewingfrustum)多少将被采样到BEV空间。默认情况下,该范围等于激光雷达标注的有效范围。当效率具有更高优先级时,观察截锥的上z轴部分可能会受到影响,因为在大多数情况下,它只包含不重要的信息,如天空。采样频率决定了图像特征的效用。更高的频率确保模型以更高的计算成本精确地采样每个BEV位置对应的图像特征。BEV分辨率决定了BEV特征的表示粒度,其中每个特征可以精确地追溯到世界坐标中的网格。需要高分辨率来更好地表示小尺度目标,如交通灯和行人。在视图变换中,特征提取操作,例如卷积块或变换块,也存在于许多BEV感知网络中。在BEV空间中添加更好的特征提取子网络也可以提高BEV感知性能。

(c)时域BEV融合。给定BEV特征的结构,BEV空间的时域融合通常利用自车姿态信息来对齐时域BEV特征。然而,在这个对齐过程中,其他智体的移动没有明确建模,因此需要模型进行额外学习。因此,为了增强对其他移动智体特征的融合,在执行时域融合时,增加交叉注意的感知范围是合理的。例如,可以扩大可变形注意模块中注意偏移的核大小,或者使用全局注意。

由于粗略的体素化和激进的下采样,现有的3D感知模型不适合识别小实例。SPVCNN在基于体素的分支中使用了MinkowskiU-Net。为了保持点云分辨率,用了一个额外的基于点分支,没有使用下采样。基于点分支和基于体素分支的特征将在网络的不同阶段相互传播。

通过对原始SPVCNN进行两次有效修改,作者提出了Voxel-SPVCNN。与简单地对原始输入特征执行体素化相比,这里采用了一个轻量三层MLP提取点特征,然后应用体素化过程。此外,基于点分支的输入被代替为体素-作-点分支(voxel-as-pointbranch)。该分支的网络结构仍然是MLP;但输入被替换为体素。Voxel-SPVCNN效率更高,因为基于点分支的计算大大减少,特别是输入是多扫描点云的情况下。

对BEV摄像机的检测任务,在BEVFormer++中采用了三个检测头。相应地,这些头涵盖三类检测器设计,包括无锚框、基于锚框和基于中心的方法。选择各种类型的检测器头,尽可能在设计上有所区别,以便充分利用检测框架在不同场景中的潜能力。头部的多样性有助于最终的集成结果。

原始的BEVFormer,用一个改进的可变形DETR解码器作为其3D检测器,可以在没有NMS的情况下端到端检测3D边框。对于该头,遵循原始设计,但使用平滑L1-损失替换原始L1-损失函数。

BEVFormer++采用FreeAnchor和CenterPoint作为替代3D检测器,其中FreeAnchor是基于锚框的检测器,可以自动学习锚框匹配,而CenterPoint是基于中心的无锚框3D检测器。预测头在推理期间提供了各种分布。值得注意的是,3D解码器远未得到很好的开发,因为高效查询设计在2D感知方面发展很成功,而如何将这些成功转移到3D感知领域将是下一步要做的

在推理过程中,使用了多个TTA,包括旋转、缩放和翻转。对于缩放,所有模型的缩放因子均设置为{0.90,0.95,1.00,1.05,1.10},因为缩放因子较大或较小对模型性能有害。翻转与训练阶段相同,即沿X轴、Y轴以及同时X轴和Y轴。旋转角度设置为{π/2,0,π/2,π}.可以选择更细粒度的缩放因子或旋转角度,但考虑到计算开销和TTA组合策略,更倾向于粗粒度参数。

BEV特征表征的一个多样性好处是,可以用2D和3D目标检测中提出的损失来训练模型。相应的损失可以通过最小化修改进行迁移,例如调整损失权重。

除了3D目标的训练损失外,辅助损失在仅摄像机BEV检测中也起着重要作用。一种类型的辅助损失是在2D特征提取器之上添加2D检测损失。这种监督增强了2D图像特征的定位,进而有助于BEV感知中视图变换提供的3D表示。

另一种类型的辅助损失是深度监督。当利用激光雷达系统生成的真值深度时,可以提高BEV感知的隐式深度估计能力,获得精确的3D目标定位。这两个辅助任务都可以在训练期间应用,提高性能。作为旁注,通常2D检测或深度预训练主干,选为初始化权重

代替传统的交叉熵损失,Geo损失和Lovasz损失用于训练所有模型。为了获得更好的不同类边界,Geo损失对有丰富细节的体素具有强烈的响应。Lovasz损失作为可微分IoU损失,能缓解类不平衡问题。

对激光雷达分割而言,作为点分类任务,分割以平均方式从不同模型中集成每点概率。具体而言,简单地将不同模型预测的概率相加,然后使用argmax操作确定每个点的分类结果。为了提高模型的多样性,用不同的数据重采样策略(称为export模型)来训练模型。根据场景和天气条件的上下文信息,在基于所有数据训练的模型上,微调多个上下文特定模型。

模型的概率在特定于模型的TTA之后以分层方式聚合。考虑到模型的多样性,模型集成分两个阶段处理。在第一阶段,同类模型的概率,例如具有不同超参数的模型,以不同的权重进行平均。然后,在第二阶段,非同类模型(即具有不同架构的模型)的概率,以不同的权重进行平均。在NNI中具有最大试验数160的退火算法,用于同时两个阶段搜索验证集的权重

还是先说仅摄像机BEV检测。虽然BEV检测消除了多摄像机目标级融合的负担,但观察到从进一步后处理中获益的显著事实。根据BEV变换的性质,重复特征可能沿着光线到摄像头中心在不同的BEV位置进行采样。这将导致对一个前景目标进行重复假检测,其中每个假检测具有不同的深度,但都可以投影回图像空间中的相同前景目标。

为了缓解这个问题,利用2D检测结果对3D检测结果进行重复移除是有益的,其中2D边框和3D边框是二分匹配(bipartitematch)。在实验中,用真实2D边框作为过滤器可以提高3D检测性能。然而,当辅助监督训练的2D检测头去预测2D边框时,发现几乎无法取得改进。这可能是由于2D检测训练不足造成的。因此,需要进一步研究联合2D/3D冗余检测的去除。

检测头设计是否体现出无NMS的特性,可以以此决定应用NMS。通常,对于一对多的分配,NMS是需要的。值得注意的是,将NMS中常用的IoU度量替换为新提出的LETIoU,以去除冗余结果,这个可以改善检测结果。这种设计更适用于仅用摄像机BEV的3D检测器。由于两个相互冗余结果的3DIoU在数值上很小,这通常导致无法消除FP结果。使用LETIoU,冗余结果往往会困扰更高的IoU,从而在很大程度上被删除。

分析混淆矩阵(confusionmatrix),发现大多数错误分类发生在相似类中。因此,语义类可以分为组,其中的类与组外的类相比非常混乱。

现有的分割方法执行逐点分类,而不考虑单个目标的一致性。例如,一些标记为前景目标的点,被错误预测为背景。基于上述分级分类,进行目标级细化可进一步提高目标级完整性。基于预测掩码同一语义组中的点,并执行欧几里德聚类,可以将点分组为实例。然后通过大多数表决(majorityvoting)确定每个实例的预测。此外,对于每个目标,由轻量级分类网络执行目标级分类的合理性,确定目标的最终预测类。

该文对近年来人们对BEV的认知进行了全面的回顾,并根据自身在BEV设计流水线中的分析,提供了一个实用的对策。巨大的挑战和未来的努力可能是:

(a)如何设计更精确的深度估计器;

(b)如何在新的融合机制中更好地对齐来自多个传感器的特征表示;

(c)如何设计一个无参网络,使算法性能不受姿态变化或传感器位置的影响,在各种场景中实现更好的泛化能力;

THE END
1.recipe是什么意思recipe怎么读中文意思用法recipe是什么意思、recipe怎么读 读音:英['res?p?] 美['r?s?pi] recipe 基本解释 n. 食谱;处方;秘诀 recipe 网络释义 n. 食谱;[临床] 处方;秘诀 recipe 词性变化 名词复数形式:recipes 中文词源 recipe 食谱,秘诀 re-,向后,往回,-cip,抓住,词源同 receive,participate.引申词义食谱,秘诀。 https://danci.gjcha.com/recipe.html
2.英语词汇recipe怎么读,是什么意思,单词翻译读音固定搭配用法单词recipe 释义recipe n 1 ~ (for sth) set of instructions for preparing a food dish, including the ingredients required 烹饪法; 食谱 [attrib 作定语] recipe books, cards 烹饪书、 食谱卡片. 2 ~ for sth (fig 比喻) method of achieving sth 方法; 秘诀; 诀窍 What is your recipe for successhttp://ec.newdu.com/28116.html
3.干货CoIP,CHIP,RIP都是些什么?01CoIP技术 CoIP技术利用抗体的特异性反应来纯化和富集目标蛋白质。具体流程如下:先将抗体与细胞裂解液或表达上清中的相应蛋白结合,再与蛋白A/G偶联的琼脂糖或Sepharose珠子进行孵育。通过离心,我们可以得到一个包含珠子、蛋白A/G、抗体和目标蛋白的复合物(如果使用MagBeads,则可以通过磁力进行分离)。在高温和还原https://baijiahao.baidu.com/s?id=1788778522061326266&wfr=spider&for=pc
4.RecipeRecipe "Recipe" has two main meanings: 1. Instructions for making something:This is the most common meaning of "recipe." It refers to aset of instructionsthat tells you what ingredients you need and how to combine them to create a specific dish, drink, or other product.https://www.bilibili.com/read/cv32168929
5.每件工业品都是艺术品的翻译是:Everyindustrialproductsareathere is a story that he bribed his cook to keep the recipe a roval secret 有故事他贿赂他的厨师保留食谱一个roval秘密[translate] aMore than 5000 measurements have been carried out in 1500 dwellingsacross the country comprising urban and nonurban locations 超过5000次测量被执行了1500年dwellingsacrohttp://eyu.zaixian-fanyi.com/fan_yi_3733250
6.语音识别模块工作原理LD3322语音识别模块难做吗问2:学了WeNet可以做点什么?比如说在科研实验方面,能够提供那些帮助? 答:WeNet这个工具包本身的定位不是提供一些基础的组件让大家去实践一些新的算法,它最大的特点是讲究落地性,它会总结并集成目前工业界最有效的一些实践的方式,相当于帮大家做了筛选,直接跳过一些坑。 https://blog.51cto.com/u_14273/11684455
7.中文特调翻译模组本身体量不大,但一生万矿及自行增长的特性都颇有意思,无论是单玩还是混搭都很推荐。 7. Exotic Industries 异域工业:通过 6 个时代的科技进步,从蒸汽开始,最终驯服异域物质。增加了多种游戏机制,各种新资源和大型机器。 贴图较为精致,解锁时代不免联想到「工业革命 3」,各星球采矿又有点「太空探索」的https://mods.factorio.com/mod/aotixzhcn
8.柔性线路板常用的专业术语详细介绍:21、Steel Rule Die(钢)刀模。是柔性线路板厂家生产FPC软板时常要用来切外形用的"刀模",其做法是将薄钢刀片,按板子外形嵌入厚木板中做成为切模,再垫以软橡皮组合的另一片垫板,以冲压方式切出柔性线路板的外形,其作业方式与一般纸器工业所用的刀模切外形者相似。与线路板厂家的模具成型有异曲同工的效果。https://zhuanlan.zhihu.com/p/35730589
9.材料课堂收藏!超全的材料专业英语词汇加聚作用(链式反应聚合)。此过程中,两个具有不同功能的独立个体呈链状聚合在一起,形成线性聚合物大分子。 Adhesive. 胶粘剂。可以使两个物体(称为被粘物)的表面连接在一起的物质。 Age hardening. See Precipitation 时效强化,见沉淀强化。 Allotropy. https://mp.weixin.qq.com/s?__biz=MzA4NDk3ODEwNQ==&mid=2698869079&idx=5&sn=9a5da4e8d80cdf723d79d49d50bf2489&chksm=baf729818d80a097e6032ed2cddf0c0699503b2452cba87dbe7e467bda9a317ad21bb5d1603d&scene=27
10.Patterns(CellPress)2022食品知识图谱在食品科学和工业中的食品知识图谱还可以用于构建智能厨房或智能工业设备,对物联网不同传感器收集的数据进行融合和挖掘并用于进一步的智能决策,构建自动化食品工业生产线和面向消费者的智能终端设备[52]。在工业上,工业机器人还能够从食品知识图谱中做出更智能的决策,它们可以通过传感器访问加工状态,获取食品材料的物理特性,并根据食品知识图谱https://www.zhuanzhi.ai/document/91af6c118a680942b741290002c57af5
11.金南瓜工业互联EAPSECS原创金南瓜通讯--SECS/GEM程式配方管理recipe是什么 过程程序是在设备控制下的指令、设置和参数集的预先计划和可重复使用的部分,这些指令、设置或参数确定了制造对象所看到的处理环境,并且可能在运行或处理周期之间发生变化。设备在针对每款产品,都需要不同的加工工艺,这个加工工艺参数统称配方recipe。配方管理简单的理解https://me.csdn.net/weixin_42113317
12.九年级英语第八单元教学设计8篇(全文)(3)依据材料三说明,在社会生产发展的同时,出现了什么问题? (4)综合上述材料,谈谈你的认识。 参考答案: 一、1.C 2.A 3.C 4.C 5.D 6.D 7.C 8.D 9.A 10.A11.A 12.D 13.D 14.A 二、15.(1)法国的“革命风暴”是指法国大革命。英国的“变革”是指工业革命。影响:极大地提高了社会生产力,直https://www.99xueshu.com/w/filekscncex4.html
13.《半导体芯片和制造——理论和工艺实用指南》AET第7章 半导体工业的发展历程 7.1 半导体产品及结构简介 7.2 半导体工业发展简史 7.3 晶体管和硅晶圆尺寸的变化 7.4 洁净室 7.5 平面工艺 参考文献 第8章 半导体光子器件 8.1 发光器件和发光原理 8.2 发光二极管 8.3 半导体二极管激光器 8.3.1 谐振腔 http://www.chinaaet.com/article/3000162418
14.recipe服装英语词典服装英语服装英语词典 精确查找模糊查找 模糊查询支持使用统配符,星号*表示多个字符,问号?表示单个字符.例如:帽?可以查到帽边 共找到3条词汇在公共词典 recipe 处方/配方 dyeingrecipe 染色配方 printingrecipe 印花处方http://www.fzengine.com/dict/dictionary.aspx?wd=recipe
15.工业自动化–ELEOKFactoryTalk View Studio的内置函数简化了将存储在数据日志模型文件集中的历史数据迁移到DataLogPro InfluxDB的过程。 要将标签的历史数据迁移到InfluxDB,操作会根据历史数据是存储在文件集中还是存储在SQL Server中而有所不同。然而,与FactoryTalk View Studio内置函数支持的在文件集中迁移历史数据不同,在SQL Server中迁移https://doc.eleok.com/industrial_automation/feed
16.全新工业支持网站谈天说地技术论坛工业支持中心VBS 实现 类似 setpicturename(主画面.pdl,画面窗口1,设置.pdl)功能你可以参考一下 我的VBS脚本Sub OnClick(ByVal Item) Dim objWindowSet objWindow=ScreenItems(PicDeviceContol)objWindow.ScreenName=SinglePhaseRecipeobjWindow.Visible=TrueEnd Sub 手机用户20230620414111 2024-08-05 17:10:10 185 1 0 参与讨论https://www.ad.siemens.com.cn/club/bbs/bbs_25_124.html
17.打开量化投资的黑箱7.4里什·纳兰/2012/机械工业出版社《打开量化投资的黑箱》内容简介:量化交易策略被投资大众称为“黑箱”,以难以理解并且难以描述而得名。尽管这种投资方法具有一定的复杂度,但如果得到很好的指导,您同样可以顺利进入这个领域,领略到其中的奥妙。 《打开量化投资的黑箱》作者里什?纳兰是一位专业基金经理,在书中他站在一个非纯粹技术性的视角介绍了量化https://book.douban.com/subject/10528799/
18.第七课启蒙运动公开课Make a shopping list and write a recipe for a food based on personal choices . Listen and chant to practice talking about food. Step1: Pre-task stage Presentation 1. Bring in some food pictures including meat, vegetables, fruit, etc. that the students have already learned and also some pihttps://www.360wenmi.com/f/fileu9v17st4.html
19.郑州航空工业管理学院教学平台Gartner在其《AI Landscape 2020》的博客文章中宣布,AI的工业化和民主化是2021年AI的两大主要趋势。早期采用者和机器翻译大师们对模型和数据的所有艰苦工作和试验终于得到了回报。我们正在从自下而上的基层运动转变为来自行政部门的自上而下的指令。在企业范围内采用MT成为人工智能或数字转换计划的一部分,现在属于CIOhttps://shiyibao.com/zzia/transNewsDetails/vr7WTyD2NiP2nP
20.珠江三角洲地区的工业品主要通过下面哪个贸易渠道大量出口()It took her one year to perfect her 1 lemonade recipe along A. complex B. expensive C. unique D. familiar 查看完整题目与答案 哥本哈根世界气候大会数据显示,伴随着工业的发展,温室气体的排放,温室效应越来越严重,全球气候变暖,自然灾害增加,大自然已经展开对人类的报复。水体污染会导致https://www.shuashuati.com/ti/27cb6545ddfc4cc6ad88b82ac1ee70fb.html?fm=bdafa7ea5773627b6f2ee2d8b39981f106
21.如何在Ubuntu16.04下配置移远RM500工业模组(5G工业模组).pdf如何在Ubuntu16.04下配置移远RM500工业模组(5G工业模组).pdf 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 如何在Ubuntu16.04下配置移远RM500?业模组(5G?业模组) 最近由于?作原因了移远的5G(RM5 H?业模组)通信开发板,由于?头上没有树莓派等原装Linux内核系统,?需要使https://m.book118.com/html/2022/1031/7055061061005010.shtm