汽车头条

上市两个月,小米推出端到端泊车。上市7个月,小米NOA实现全国能开。今年更火热的端到端+VLM技术,实现车位到车位辅助驾驶,也在不久之前搭载进入小米SU7,我们已经给大家提前试过,相信很快也会正式交付。

智驾功能快速落地的背后,是小米研发的提前布局,以及研发起点跳过规则时代,乘着东风迎接端到端+VLM,少踩了很多坑。11月14日,广州车展媒体日前一天,小米汽车首次展示车位到车位的智驾能力,雷军直接上路直播。期间,自动驾驶部总经理叶航军谈到明年的两个目标:量产车位到车位和数据积累。

为什么是这两个目标?带着这个问题,加上我们对小米车位到车位智驾首次体验后的各种疑问,我们在沟通会上与小米汽车智驾团队进行了深入交流。

在和智驾团队的交流中,他们特别谈到了端到端+VLM技术的落地。一年之前,小米智驾团队已经尝试布局端到端,今年首先落地泊车场景,接着打通城市智驾和泊车,也就是车位到车位,未来也会将端到端更新到高速智驾中。

目标是明年的此时,VLM的下一代VLA或许就有雏型了。视觉模型不仅仅能看到,在看到之后也将有动作的反馈。

谈到Transformer下一代技术的可能性,智驾团队认为,目前业内还没探索到像CNN到Transformer这么大跃升的技术,接下来一个时期的重点,依然是端到端。

在接近2小时的对谈中,智驾团队还输出了小米智驾在技术、团队、未来发展等方面的诸多细节。我们也将对话进行了书面整理。

Q:小米的车位到车位智驾已经是端到端+VLM了,小米端到端什么时候立项?

Q:既然早就规划了要做端到端,为什么还要先推送无图全国能开的版本?

A:无图和端到端并不是先后的关系,是事物的两个维度。这点可能是市场或者产品的同事认为这个阶段可以提供给用户,获取一点反馈,二者的研发并不割裂。

Q:和端到端能力一起上线的还有VLM,目前VLM有怎样的能力?

A:VLM的提醒功能,是目前可以产品化的阶段,它最大的作用就是识别这个大千世界。

今天语音播报可能觉得很新奇,明天播报可能觉得也还好,但是天天播报用户可能会觉得你能为我做点什么。因此,基于VLM的应用,将来一定会从语音播报,进化到车辆的「动作」。没错,这就是VLM的下一代VLA(Vision-Language-ActionModel)。

从VLM到VLA,从功能上看大致可以分为三个阶段:

目前,VLM的能力正处于第一阶段,传感器感知到环境后,通过语音和文字提醒驾驶员。

接下来第二阶段,VLM可能针对特定的场景做保护或绕行工作。

第三阶段就是进化到VLA,一个模型就能直接出轨迹(Action)。

Q:明年小米智驾团队的研发规划是怎样的?

A:明年小米智驾将专注于两件事,一个是端到端全场景车位到车位智能驾驶,目标是今年年底推出内测版,推给千人规模,形成内测团,到明年初,将以最快的速度把车位到车位做到全量量产交付。

Q:小米智驾团队明年的两个目标之一是数据积累,如何定义高质量的数据?高质量数据在所有智驾数据中的占比是多少?

A:这一点其实和人的学习过程非常像。例如,人在学习开车的时候,先是会走直线,然后会转弯。从不会到会,需要不少这样的「正例」样本。

而从会开车到熟练驾驶,则需要更多的「负例」样本,这可能是开车遇到的危险情况,可能是遭遇的危险天气。

因此,高质量的数据既要有驾驶过程中的「正例」样本,同样也需要大量的「负例」样本。

针对训练正向能力,大概有1%-5%的数据是有价值的。

而针对训练负向能力,还会远远低于这个比例,甚至有些数据是可遇而不可求的。因此为了解决这方面的问题,不光要从数据当中挖掘,还要做一些数据挖掘,例如在危险场景下再把危险程度提高。目前,小米智驾团队正在做的预研工作,发现通过这些数据训练还是非常有用的。

Q:智驾已经从规则时代走向端到端,是不是意味着智驾研发所需要的人更少了,需要多少人?

A:做一个不太恰当的比喻,以前大家在车端写规则,现在大家则是在云端写「规则」、找数据,其实是知识注入的方式发生了变化。这样有一个好处,更适合大规模地部署。

在曾经的规则时代,20个人写规则,但写得多了代码也就没法用了,因为规则会互相「打架」。但现在200人同时做数据就没问题。

因此,当前智驾研发并不是不需要专家或者不需要人了,相反人的数量不一定变少,大家都变成云端的专家了。

Q:现在有没有看到能够颠覆Transformer的下一代技术?

A:目前来看,还没看到能有从CNN到Transformer这么大跳跃的技术。未来1-2年应该是这样,要把端到端推到量产,就像是BEV+Transformer业内也通过1-2年才实现的量产。如果说更长远其实没有意义。

现在全行业还在积极地探索,或者说在做一些尝试,但最近还没有能够特别眼前一亮的东西,最近能够引发大家思考的其实是OpenAI的o1模型。

Q:小米智驾起步相对较晚,避开了规则时代的「坑」,直接做端到端会更有优势吗?

A:小米智驾的第一版就是BEV+Transformer,因此小米有很强的后发优势。同时,小米汽车依托集团,并非从0开始。其实各家都是这么多人,谁也不比谁聪明,并且这个行业大家都很勤奋。

Q:如何理解智驾领域的世界模型?

A:人类做事情的时候大脑会做平行推演。比如开车遇到障碍物时,人会同步评估「直接绕行」、「原地等待」、「探出车头看看」等多种操作及相应的结果,也就是预测未来的多个「平行时空」。对于智能驾驶,也需要一个引擎来预测自车各种可能的行为对周边环境未来3-5秒的影响,这个引擎就是世界模型。

这其实是个强化学习的概念,最大的难点在于世界模型要做好。但是强化学习做好的前提是世界模型要足够真。因此这是一个先有蛋还是先有鸡的问题。目前来说,还很难做出一个很真的世界模型,真实的世界模型其实就是《黑客帝国》中描述的场景。如果不够真,那想象出来的东西就是幻觉,给的东西都是错的。

Q:目前能够看到各家智驾功能上的差距越来越小,未来如何体现差异化?

A:各家的差异更多体现在能多大程度满足用户真实需求,而不是一直炫技而无法满足用户刚需。

Q:您认为端到端技术以及全国都能开功能,各家都「卷」完了吗?

Q:小米智驾现阶段的目标是进入行业的第一阵营,内部如何评估「第一阵营」?

A:对于智驾的评价是多维度的,我们很看重真实使用情况。用户的接管次数算一个,另外就是用户活跃度。

Q:目前试驾的车位到车位智驾,我们认为红绿灯起步速度相对慢,您怎么看待这个问题?

A:小米智驾做得比较快,同时目前整套系统由于在量产交付之前,还是有优化空间,这个场景可能延迟会大一些,目前相应的工程优化一直在做。

Q:小米智驾认为哪个城市对于智驾考验最大?

A:一方面是地理环境难,比如像重庆。另一种是交通设施有明显差异的,比如某些城市车道、交通灯位置不同。

小米不会对不同城市或者不同驾驶习惯做优化,最后可能是成为一个「超级司机」。

THE END
1.一引言精密解答落实1、丰富的功能:小米驾车场景集成了导航、语音助手、车辆控制等多项功能,满足驾驶者的多种需求。 2、先进的技术:凭借小米公司在人工智能、物联网等领域的深厚积累,小米驾车场景的技术水平处于行业前列。 3、兼容性强:小米驾车场景可以兼容多种车型,让更多的驾驶者享受到智能化的驾驶体验。 http://news.ynyxwh.cn/explain/13305.html
2.测试数据测试题题库功能测试区2论坛测试数据测试题题库8 0 功能测试区2论坛 查看全部 之家车友1408487 楼主 2024-12-10 20:04:17 测试数据测试题题库 +1 0点赞 收藏 分享 推荐阅读 更多精选帖子 回复楼主 举报 首页 上一页 下一页 末页 给我们建议 ?2018 汽车之家 m.autohome.com.cnhttps://club.m.autohome.com.cn/bbs/threadowner/23e18d99d1b2ac16/110034172-1.html
3.学小米汽车弄个智驾课堂,然后定期考试,考来自谝寒船学小米汽车弄个智驾课堂,然后定期考试,考试过了再用智驾,道路千万条,安全第一条。 ?收藏 1 5 ?9 评论 o p 同时转发到我的微博 按热度 按时间 正在加载,请稍候 数码博主 微博译制视频博主 ü 简介: 构建信息对称的清朗世界,成为宇宙第一KML。商务合作:waynemu88 更https://weibo.com/6046860545/OiNACqWuh
4.满分12分模拟考试题库车友交流懂车帝提供满分12分模拟考试题库的车友交流详细内容,懂车帝是一个汽车资讯平台,懂车更懂你。我们提供最新汽车报价,汽车图片,汽车价格大全,行情、评测、导购等内容,看车选车买车就上懂车帝。https://www.dongchedi.com/tag/ugc/16138839
5.雷军:小米汽车今年将进入智驾第一梯队南方+南都记者关注到,此前在小米汽车技术发布会上,小米针对智能驾驶的代客泊车场景自研了全球首个可量产的“端到端感知决策大模型”,可以实时观察、动态调整泊入机械库位等超高难度车位。 三是规范车端数据使用,提升智能驾驶产品安全水平。雷军表示,智能驾驶安全水平提升依赖车端和道路真实数据的反馈,为更加合规、高效地利https://static.nfapp.southcn.com/content/202403/05/c8660851.html
6.小米汽车详细解析SU7智驾Max与标准版的区别值得一提的是,小米SU7全系车型均支持机械库位泊车功能,这一功能也将通过OTA的方式进行推送,为车主提供更多便利。 综上所述,小米SU7智驾Max与标准版在智能驾驶辅助功能上各有千秋,但Pro版本凭借其城市领航辅助(城市NOA)功能,无疑在智能驾驶领域更具竞争力。而小米汽车对于后续功能的升级推送,也展现了其对用户需求https://www.yoojia.com/article/8486029458750195513.html
7.小米汽车智驾学堂必修课之《车道居中辅助功能教学》小米汽车智驾学堂必修课之《车道居中辅助功能教学》 只有熟悉并通过考试,才有机会开启小米汽车的车道居中辅助功能。 课前提醒: 1功能使用说明: ①ACC自适应巡航:可在功能规范的车速范围内,根据驾驶员设定的巡航速度与跟车距离,控制车辆的纵向行为。 https://www.douyin.com/note/7417084904728497434
8.小米汽车智驾一路狂飙,即将开启端到端内测因此,现在的小米汽车正面临着巨大的压力,在各家车企接连传出“端到端大模型”落地的黄金时期,小米汽车能否在今年实现端到端智驾意味着未来能否拥有更强的产品力,这也将影响到后续小米汽车产品规划以及商业布局。 在今年9月份,小米汽车内部传出智能驾驶团队完成新一轮组织架构调整,“感知”和“规控”两个二级部门http://heyanyueche.com/productinfo/3142426.html
9.平安证券汽车行业年度策略报告:增程车2.0,AI智驾1.024121217、汽车·行业年度策略报告5/32图表34智驾体验迭代的典型样本——小鹏汽车端到端智驾迭代步骤22图表35智驾体验增程车2.0迭代的典型样本——华为ADS发展路径23图表36特斯拉FSDV12上车以后车辆安全水平大幅提升23图表37理想汽车智驾版本迭代提升NOA里程占比24图表38特斯拉FSD累积里程达20亿英里25图表39理想智能驾驶训练里程单http://huiyunyan.com/doc-feaea1c83fde246508c750485f2a197e.html
10.参与新股申购的最低门槛是什么?如图所示为氢原子的能级图.让一束单色光照射到大量处于基态(量子数n=1)的氢原子上,被激发的氢原子能自发地发出3种不同频率的色光,则照射氢原子的单色光的光子能量为__eV.用这种光照射逸出功为4.54eV的金属表面时,逸出的光电子的最大初动能是__eV.(2)下列说法正确的是__。https://www.shuashuati.com/ti/a1d8dbb5da7f44fb92c76d7b1d370072.html
11.雷军直播开小米汽车时被别车智驾挑战突遇惊险插曲新闻频道雷军及其他小米高管的直播活动,反映了企业传播趋向直接化的新趋势,越来越多的企业领导者亲自参与内容创作,成为网络红人。雷军频繁现身新媒体平台,不仅提升了个人影响力,也为小米树立了鲜活的品牌形象。随着更多企业高管加入直播行列,如360的周鸿祎、蔚来的李斌、格力的董明珠乃至远在美国的贾跃亭,企业公关传播的“去中介化https://news.china.com/socialgd/10000169/20240518/46551570_1.html
12.对标保时捷特斯拉,小米汽车要卖多少钱?雷军回应12月28日,小米宣布进军电动汽车行业的第1003天,小米汽车举行技术发布会,首款产品SU7揭开神秘面纱。雷军称,小米汽车要通过15年到20年的努力,成为全球前五的汽车厂商。此次发布会并未公布SU7价格,雷军只是表示,售价9.9万是不可能的,“说14万9的人也不要再说了”。 http://news.hnr.cn/shxw/article/1/1740322219633475586
13.小米汽车智能驾驶新进展81EFLOPS超大算力助力未来智驾系统再升级【ITBEAR】小米汽车近日在官方渠道发布了第93集答网友问,其中涉及了多款车型的智能驾驶功能升级、一起交通事故的澄清以及广州车展的展出计划等多个热点话题。 在智能驾驶方面,小米汽车确认了其SU7 Pro车型将支持“车位到车位”的端到端智驾功能,这一功能也被官方命名为全场景智能驾驶。该功能将作为HAD小米超级智能驾驶https://www.ze6qklydq.cn/shou-ji/349126.html
14.2024极术通讯小米SU7汽车智驾芯片一览小米智驾芯片极术社区近期发布了一系列技术文章,涵盖了Cache一致性、操作系统异常处理、深度学习在资源受限设备上的部署、微软Mora框架、智能汽车芯片、AI计算平台(AIPC)与SAQP技术等。这些文章揭示了IT领域的最新进展和产业发展动态。 摘要由CSDN通过智能技术生成 导读:极术社区推出极术通讯,引入行业媒体和技术社区、咨询机构优质内容https://blog.csdn.net/weixin_47569031/article/details/137272068