通过学习轮胎模型利用3分钟数据实现自主漂移汽车技术

编者按:该会议论文提出一种可学习的轮胎模型,利用神经网络的非线性学习能力提高了车辆在接近附着极限的工况下的轨迹跟踪能力,是数据驱动方法应用在车辆控制领域的一个新的尝试,并通过实车验证了该轮胎模型的有效性,不仅是对轮胎动力学非线性建模的一大发展,更显示了数据驱动方法对传统动力学控制领域的潜力。

本文译自:

《AutonomousDriftingwith3MinutesofDataviaLearnedTireModels》

2023IEEEInternationalConferenceonRoboticsandAutomation(ICRA),29May2023-02June2023

作者:

FranckDjeumou1,JonathanY.M.Goh2,UfukTopcu1,AvinashBalachandran2

作者单位:

1theUniversityofTexasatAustin,Austin,TX,USA.,

2ToyotaResearchInstitute,LosAltos,CA,USA.

原文链接:

最大程度的使用轮胎力对于安全处理高度动态的情况至关重要,例如紧急避障。然而,准确预测汽车四个轮胎上产生的有效力是一个巨大挑战。首先,轮胎有许多复杂的非线性特性,包括轮胎力饱和、侧偏特性以及依赖于非线性负荷。实际上,已经投入了大量的努力来开发单个轮胎的机理和经验模型[1–7],包括在工业中经常使用的“魔术公式”[1]。尽管它很受欢迎,但拟合“魔术公式”的许多参数是困难的,通常需要专门的测试和设施[2,3]。

当轮胎连接到车辆时,其复杂性会增加,因为这些模型的每个输入都与悬架动力学、载荷转移和其他效应耦合在一起。许多文献中采用的控制方法都对车辆进行单轨假设,将这些效应“集成”到前后轴的单个轮胎模型中[8–13],并通过实车数据进行经验拟合。这包括Fiala刷子模型[14],该模型已在自动驾驶车辆控制场景中得到实验验证,包括紧急避障、漂移和赛车[15–20]。尽管这种简化有利于控制器的开发,但这种集成的单轮胎往往无法准确捕捉由高阶效应产生的复杂耦合特性。

神经网络,由于其在极端情况下具有通用逼近的性质,可能提供了一个解决方案。在文献中,基于黑盒和魔术公式的神经网络模型[4–7,21–23]已经被开发。然而,它们没有保证物理约束,并且没有在接近或处于操控极限的整车上进行测试。一般来说,它们的复杂性必须在过拟合和计算效率之间进行平衡,尤其是在需要可靠的、具有物理意义的外推以实现实时控制时。

最后一组实验展示了我们模型的数据效率和泛化能力。我们更换了一组不同的轮胎,收集了3分钟的手动驾驶数据,训练一个ExpTanh模型仅用了几秒钟,然后进行了八字形的自动驾驶漂移实验,如图1所示。学习到的模型显示出同样良好的闭环性能,而基准模型的性能下降了。

图1这幅光复合材料展示了来自无人机视频的静帧,记录了一个完全自主实验,画面以1秒间隔叠加。每一帧捕捉了实验过程中的关键时刻,展示了系统在不同阶段的表现和反应,提供了对自主驾驶能力的直观理解。

车辆动力学。本文使用的车辆动力学模型为平面单轨模型[8,10–12],如图2所示。它们在一个曲线坐标系[15,18,19]中表达,其中车辆的位置是相对于参考轨迹的。位置坐标由沿路径的距离、相对于规划路径的偏航角和横向偏差描述。运动状态的动力学约束为,其中矩阵具体形式见文献。状态、、和分别表示横摆角速度、车速、侧滑角和前/后轴转速。控制量代表转向角和作用在前/后轴上的力矩。此外,、、和分别定义了前轴纵向、前轴横向、后轴纵向和后轴横向轮胎力。在后续讨论中,我们使用和分别指代和,下文分析时会省略下标。

图2给定参考轨迹上的单轨模型

轮胎力基本原理。对非线性轮胎力和的建模已有大量的研究。许多模型认为这些力是由轮胎与路面接触面之间的相对“滑移”产生的。侧偏角、纵向滑移比和总滑移通常用作轮胎力的模型输入,如式子(1)所示:

其中,,是车轮的有效半径,和分别是从质心到前后轴的距离。考虑非负,满足,同时由于的非负性,。

轮胎力的测量。在这项工作中,我们从测量到的状态量和集中到车轴上的力的估计值学习轮胎模型。虽然估计这些力有很多方法,本文为了简化问题,假设,即前轮不产生扭矩的情况,我们从测量的状态量计算,和,然后通过矩阵反推得到估计力,用表示[15]。

在本节中,我们将介绍所提出的基于物理的神经常微分方程(NODE)模型及其推导出的ExpTanh参数化方法。遵循轮胎建模的惯例,我们将讨论分为纯滑移与组合滑移两种工况。在纯滑移工况下,轮胎仅沿单一轴向产生力(即纵向滑移比或);在组合滑移工况下,轮胎同时产生纵向力与侧向力(即滑移率且侧偏角)。根据轮胎基本理论,我们预期所建立的模型具有以下行为特征,具体总结见图3。

图3左侧图示展示了纯滑移状态下的拐点()及其对()的凸性/凹性的变化。右侧图示则展示了组合滑移状态下的总力()的拐点()。

标准化的S形曲线。随着滑移率或侧偏角的绝对值增大,轮胎力的大小也随之增大直到达到一个峰值,随后轮胎与地面的接触区域开始滑动。在峰值点之后,力减小,整个曲线呈“S”形。在纯滑移工况下,输入的滑移量是滑移率或侧偏角。在组合滑移工况下,输入的滑移量是滑移率和侧偏角的组合,输出的力为。

组合滑移工况。对于组合滑移,总力的各分量按照侧偏角与纵向滑移相在组合滑移工况下所占比例进行分配。如图3所示,例如,在固定滑移率的情况下,随着侧偏角从0逐渐增大,纵向力的比例减少而侧向力的比例增加直至饱和。

摩擦的限制。在这两种状态下,最大附着力受到轮胎与路面之间最大附着能力的限制,其中是摩擦系数,是施加在轮胎上的垂直载荷。由于摩擦系数依赖于路面、轮胎方向和垂直载荷,而垂直载荷又因车辆状态(如重心转移和悬挂动态响应)而变化,因此很难精确确定。然而,最大附着力的这一概念极大地简化了控制和安全分析。

在本文中,我们假设一组给定的测量值,其中是对额定载荷的粗略估计,而则代表了关于的任何可用信息。

A.基于物理的轮胎力模型NODE

具体而言,在关键拐点处(见图3),曲线会改变其凸性或凹性。在纯滑移状态下,包含三个拐点。对于我们需要的曲线族,应该使得其对于所有的和,呈现凸性,而在其他情况下则呈现凹性。同样地,对于,在参数下也有相同的性质。在组合滑移状态下,的曲线族包含一个拐点,使得呈现凹性,而在其他情况下则呈现凸性。凸性和凹性分别对应于非负和非正的二阶导数。因此,主要思路是在施加所需的凸性/凹性属性的同时,学习轮胎力相对于相应滑移的拐点和二阶导数;力则是通过积分获得的。此外,我们还根据摩擦极限的要求对峰值力施加软约束。

纯滑移NODE模型。侧向力是二阶微分方程的解:

其中,微分是通过对进行求导得到的。对于前轴,用于学习的特征集为,对于后轴为。我们选择特征集以确保在给定固定的时,由式(1)给出的并不唯一。表示一个神经网络,其中是模型的所有参数集合。拐点可以参数化为,其中,是在对微分方程积分时使用的初始状态。需要注意的是,在中需要选择指数函数强制执行非负和非正的二阶导数约束。随后,我们通过求解以下优化问题来计算参数。

其中,是从到测量的在初始条件下的积分。一项通过惩罚超过估计名义载荷的值作为软约束确保系统不超过摩擦力极限。超参数指定了对的置信度:较低的值允许峰值力根据数据进行调整,而较高的值则限制峰值力不超过。

组合滑移NODE模型。合力是如下所示二阶微分方程的解:

其中,微分通过对组合滑移求导得到。,再次选择特征集,以确保侧偏角和纵向滑移率不是定值。接下来,为了了解这一合力的分量分布,我们定义,并通过如下方式按比例缩放来估计和:

因此,可以通过求解如下问题来求解参数:

其中,被测量的合力为

注释1:在纯滑移状态下,学习和学习的方式相同,只需将替换为。尽管NODE公式化能够编码丰富的函数类,但求解方程(2)和(4)以估计力的过程会减慢训练速度,并妨碍该公式化在控制中的直接应用。实际上,我们通过首先学习参数,然后训练一个新的神经网络来模仿方程(2)和(4)的解,以此解决这一问题。这样,评估所获得的神经网络及其雅可比矩阵在实时控制中就变得计算成本低廉。

B.ExpTanh:一个新的轮胎模型族

我们限制NODE模型的解集到一类特定的函数族,即ExpTanh,这类函数在无需积分微分方程的情况下即可满足二阶导数条件。ExpTanh曲线由下式给出:

其中是常数或神经网络函数,满足。最重要的是,可以通过解析式的方式得到:

ExpTanh纯滑移模型。我们将建模为,其中,与NODE版本中的特征相同,且是所有参数的集合。实际上,我们通过指数函数传递同时确保非负值。最优参数由以下方式给出:

其中第二项是对超过估计的最大摩擦力的软约束。

ExpTanh组合滑移模型。我们将总力建模为,其中,并且与NODE版本中的特征相同。和取决于等式(5)给出的总力,其中函数,需要学习得到。特别的,我们可以通过计算下式得到:

注释2:首先,通过结合选定的测量状态子集以及滑移值,所提出的模型能够捕捉有效综合轮胎力曲线与车辆运动之间的复杂耦合关系。虽然我们为选择了特定的组合,但根据车辆的不同,其他选择也可能适用。其次,对于固定的参数,ExpTanh仅需两次计算指数函数,相比需要三次计算反正切函数的魔术公式,其计算成本更低;同时,其梯度也更容易计算。

我们通过以下多项实验证明了所提出轮胎模型的数据效率、预测准确性和计算效率:在测试平台车辆数据集上与魔术公式和Fiala刷子模型的对比实验,以及在自动驾驶在蛇形轨迹和八字形回转轨迹上的自动驾驶漂移实验。

本节中的实验是在文献[26,27]中描述的丰田Supra上进行的,并针对高性能自动驾驶进行了大量改装,通过商用RTKGPS-INS设备测量车辆状态测量,采集速率为250Hz。对于这类后轮驱动的车辆,前轮在纯打滑状态下工作,,后轮处于组合滑移区。在未指定单位时,我们假设所有量均为标准单位。

A.学习型轮胎模型的评价

对于NODE模型,、和有2个隐藏层,每层有16个神经元,而每层有4个神经元。对于模型,和有2个隐藏层,每层有3个神经元。所有神经元都使用tanh作为激活函数。我们使用来表示对估计的的低置信度。我们通过Adam优化器[28]对模型进行了训练,学习率设置为指数衰减,衰减率为0.01,初始值为0.001。在配备GeForceRTX2060的笔记本电脑上,训练纯滑移模型和组合滑移和模型,NODE需要27分钟,而模型仅需要4分钟。

图5显示了学习的ExpTanh模型如何有效捕捉与车辆状态横摆角速度、纵向车速和侧滑角的耦合。结果表明,所提出的模型不仅与轮胎特性吻合,还能结合复杂的底盘相互作用(如载荷转移和悬架动力学)。车辆在纯滑移状态下,由于其特定的悬挂设计和由此产生的显著静态与动态侧倾,导致车辆的中心相对于理想曲线中心发生了偏移。这种偏移会影响车辆的操控性和稳定性,尤其在漂移时更加明显。低车速下,曲线趋于平缓,而随着侧滑角的增大,侧向附着力峰值所对应的滑移角减小。对于组合滑移模型,在低纵向滑移的非线性过渡区域,横摆角速度和车速的相互依赖最为显著。按照轮胎基本特性,后轮纵向滑移比固定,随着滑移角的增大而减小。

图4在实际驾驶数据集上训练和测试的不同轮胎模型的比较。第一行显示的是预测误差的密度分布,第二行显示的是在固定状态横摆角速度、车速、侧滑角下力与滑移值的函数关系,其中是在时得到的,是在时得到的。在密度图中,NODE模型和ExpTanh模型在零均值误差附近的密度至少是专家设计的Fiala模型和魔术公式的1.5倍。第二行验证了学习的NODE和ExpTanh模型满足轮胎基本性质。

图5横摆角速度、车速、侧滑角对学习型ExpTanh模型的影响。对于前轮,蓝色曲线对应横摆角速度,侧滑角,车速值范围为5至20,较低的值用较浅的颜色表示。绿色曲线和蓝色曲线基本一致,仅侧滑角。橙色曲线横摆角速度和车速固定,侧滑角在-0.9到0.9之间变化。对于后轮胎,蓝色曲线的值范围为5至20,值固定为-1.8;绿色曲线的值范围为-1.8至1.8,值固定为12;橙色曲线的值和值均有变化。

B.利用学习型轮胎模型的自主漂移实验

为了评估它们的实际闭环性能,我们在图4中使用我们学习到的模型直接替换现有自主漂移闭环NMPC框架中的Fiala模型[16,27]。参考轨迹是通过基准Fiala模型的非线性优化预先计算出来的。NMPC成本函数主要包括横向误差、与参考侧滑角的偏差以及相对偏差。侧滑角决定了漂移的特征和行为。

1)蛇形轨迹漂移

在第一个实验中,我们比较了基准Fiala模型、NODE模型和ExpTanh模型在瞬态蛇形轨迹上的闭环性能(图6)。集成的NODE模型是用使用一个神经网络输出近似。蛇形轨迹的拐角参考侧滑角最大为43°,速度介于31mph和45mph之间。图6展示了改进后的跟踪性能:就均方根误差而言,ExpTanh对路径(误差和偏离)的跟踪性能比Fiala模型高出3.5倍,同时侧滑跟踪性能也高出1.5倍。NODE模型的性能略低于ExpTanh,这可能是由于近似过程中的精度损失。重要的是,与基线Fiala模型相比,使用ExpTanh和NODE时,转向振荡更少。

2)利用3分钟数据实现自主漂移

这组实验研究了ExpTanh模型的通用性。首先,我们使用基准Fiala模型和ExpTanh模型在八字形轨迹上进行实验。然后,我们将后轮胎从之前所有测试中使用的ToyoProxesSport275/35R18换成了BridgestonePotenzaSport275/35R18。一名安全驾驶员随后在滑行平台上手动驾驶车辆,进行不规则抓地力和漂移动作,持续约3分钟。随后,这些数据用于训练一个ExpTanh模型,该过程在配备GeForceRTX2060的笔记本电脑上耗时不到15秒。训练完成后,新模型与基准模型在相同的“8”字轨迹上进行了对比分析。

图7总结了我们的研究发现。对于原始的Toyo轮胎,使用ExpTanh模型的性能显著优于基准Fiala模型。重要的是,在更换为新的Bridgestone轮胎并重新训练网络后,ExpTanh模型的闭环行为保持相似。相比之下,未更改的Fiala模型性能显著下降,这表明轮胎的行为确实存在明显差异,而ExpTanh模型成功地通过稀疏数据进行了适应。这一点在均方根误差(RMSE)和侧滑追踪误差()值中也得到了反映:与基准模型相比,我们在横向误差上实现了超过4倍的改善,在侧滑跟踪上实现了超过2倍的改善,适用于两种轮胎。

图6在八字形轨迹上漂移。与Fiala模型相比,我们的方法显示出更高的轨迹跟踪精度和更少的转向振荡。

图7使用3分钟的数据在八字形轨迹上漂移。ExpTanh模型在两种轮胎的跟踪性能都更好,尤其是在过渡区域。红线表示Bridgestone+Fiala测试结束的位置,原因是安全驾驶员对跟踪误差感到不适。

使用ExpTanh模型时,控制器在侧滑角参考值的追踪上表现出较少的超调和较少的转向振荡,与Fiala模型相比。这种差异在每个过渡的结束阶段尤为明显,如侧滑演变的放大部分所示,在此阶段,由于瞬时载荷转移和高偏航率,我们预计会看到车辆状态之间更复杂的相互作用。这表明,ExpTanh模型不仅能够捕捉这些效应,还能使控制器在闭环操作中利用这些效应。相比之下,使用Fiala模型的控制器在这些过渡期间往往会出现严重的超调现象。

另一个具有复杂耦合的区域是在实验结束时从漂移到抓地驾驶的缓慢过渡(例如,)。在这个阶段,基准的Toyo+Fiala模型组合表现出明显的转向和侧滑振荡。相比之下,使用两种轮胎的ExpTanh模型能够平滑地追踪侧滑,并且在横向误差性能上表现更佳。

THE END
1.八字测算平台功能搭建(源代码系统开发)八字测算系统开发,八字测算软件开发,八字测算app开发,八字测算商城软件开发,八字测算系统模式开发,八字测算商城系统开发,八字测算系统开发搭建,八字测算微商系统模式开发。 八字一词命理界无所不知,八字到底有多少种?大部分人认为八字总共有一百一拾二万三千二百种。其实这是没有掌握当代完整预测模式的误会;因为深入到四柱http://guangzhou.11467.com/info/22073221.htm
2.计算公式解析> 计算公式解析 基金卖出手续费详解,计算公式及计算方法全解析落花飘雪 2024-11-30 16:02:02 没有更多内容 滇ICP备2023010045号-86 本文内容由互联网用户自发贡献,该文观点仅代表作者本人,因此内容不代表本站观点、本站不对文章中的任何观点负责,内容版权归原作者所有、内容只用于提供信息阅读,无任何商业用途。本http://m.lffenquanban.com/tags-67248.html
3.八字入门四柱八字理论基础知识[精编文档]经管文个表示具体时点的四柱八个字为依据论这个时点出生之人的命运,而成系统的论命方法,称为四柱论命或八https://bbs.pinggu.org/forum.php?mod=viewthread&tid=12996240&ordertype=2
4.在现代社会人们如何结合科技手段来解读和应用八字真言口诀呢在古代,由于信息获取和计算能力有限,所以人们只能依靠天文学知识来推算出人生时间中的具体日期。但随着科学技术的发展,现在我们可以更精确地计算出每个人生命中的每一个瞬间。这样就使得根据当下的时间来分析过去或者未来变得可能,而这一点对于使用八字进行预测来说至关重要。 https://www.kkrtggh.cn/dao-jia-si-xiang/786360.html
5.八字模型的公式八字模型的公式是:【八字模型定律】八字结构定律诀,(明暗两面)四天干为明,四地支为暗。https://zhidao.baidu.com/question/2019626600770674308.html
6.干货值得收藏的30个运营营销实用模型个人号流量矩阵 电商转化的八字箴言 6种营销策略(来自李叫兽) 品牌尖刀模型—感官营销 品牌定位画布 品牌心智定位 市场定位与企业战略 服务设计的消费动力公式 状态认知 用户研究图谱 用户增长地图 用户体验地图 情感化设计链路 增长黑客理念 产品的需求来源 https://maimai.cn/article/detail?fid=1395165745&efid=hxRRhAiXCHz5yVx98_5cnA
7.漏泄电缆范文6篇(全文)传输衰减是反映电磁能量在电缆内部传输能量的损耗,其值随频率变化而变化,单位d B/km,理论计算公式如式(2)所示[10] 其中,α是给定频率的传输衰减;α1是导体衰减;α2是介质衰减;α3是辐射衰减。 导体衰减是由于电缆内外导体自身特性所引起的能量损耗,定义如式(3)所示[10] https://www.99xueshu.com/w/ikeyhxe0d0ko.html
8.沙漏模型公式1、沙漏模型公式有两个:AD/AB=AE/AC=DE/BC=AF/AG; S△ADE:S△ABC?=AF^2:AG^2。 2、沙漏由两个白色的座子和三根透明的柱子搭成,中间是两个水滴形状的透明玻璃罩组成的葫芦。它的玻璃罩里有许多紫色的沙粒,这些沙粒能通过小孔,从一个玻璃罩流向另一个玻璃罩。没错,它就是沙漏。沙漏也叫沙钟,是古代http://m.zuowenhang.com/bk2729940.html
9.PowerBIDAX函数入门powerbidax函数DAX的全称是DATA ANALYSIS EXPRESSION,是一个公式表达式语言。 DAX公式包括函数、运算符和值,用于对表格数据模型中相关表和列中的数据执行高级计算和查询。 用在度量值、计算列、计算表和行级别安全性中使用。 度量值 度量值的作用在于解决数据并不包含解决某些重要问题所需的所有内容。 https://blog.csdn.net/baidu_38766791/article/details/116142109
10.框架涵施工小结(精选6篇)八字墙基础为15号混凝土,施工时与台墙基础一起进行。墙身为现浇15号混凝土,施工方法和台墙的施工方法一样。 (七)、附属工程 附属工程按照设计图纸的尺寸、高程放样后组织施工,严格执行有关施工规范的要求,确保工程质量。 (八)、台背回填 1、台背填土必须涵身混凝土强度达到设计强度的80%以后,方可进行回填。 https://www.360wenmi.com/f/filee6wj4j2h.html
11.八字命理之古法模型浅析开篇先说两点,我还是曾经说过的老观点:我是不推荐算八字,因为我精通修八字命理才会有此建议。八字的理论和我们现实世界运行机制是矛盾的,八字讲究命定论,但是世间万物是无时无刻不在变化。八字之所以民间如此普遍流行,是因为江湖派为了谋生的忽悠罢了。八字相当于一个固定公式去推导命运,这本身就站不住脚。同样一件https://www.douban.com/note/841868825/
12.手拉手模型20240119(6)BH平分∠AHC;解题思路1出现共顶点的等边三角形,联想手拉手模型2利用边角边证明全等;3八字导角得角相等;2如图两个等腰直角三角形ADC与EDG,连接AG,CE,二者相交于H.等腰直角三角形要得到哪些结论?要联想到什么模型?问 (1)△ADG≌△CDE是否成立? (2)AG是否与CE相等? https://www.yxfsz.com/view/1748240765925036034