本文作者:访客

端到端大模型到底是个啥 小米官方详解

访客 2024-11-16 16:00:10 274863 抢沙发
端到端大模型到底是个啥 小米官方详解摘要: 11月16日消息,小米HAD(Xiaomi Hyper Autonomous Driving)将全面接入端到端大模型,智驾体验重大升级,预计12月底开启先锋版推送。Xiaomi...

11月16日消息,小米HAD(Xiaomi Hyper Autonomous Driving)将全面接入端到端大模型,智驾体验重大升级,预计12月底开启先锋版推送。

Xiaomi HAD 将在 小米SU7 Pro 、小米SU7 Max和小米SU7 Ultra 上搭载。

那么什么是端到端大模型?小米的端到端大模型与主流的端到端大模型有什么区别?小米汽车官方进行了详解。

简单来说,端到端大模型就像是人的大脑,你的眼睛看到了红灯,大脑就立即告诉你要停车。端到端大模型就是智能驾驶的机械大脑。

在端到端技术到来之前,传统的智驾大体上都是一个个有规则的子模块连接而成,相当于一个个工作车间,对传感器收集到的信息进行判断加工,最后输出行驶指令。

模块化架构的优点是分工明确,如果发现问题,可以分模块检查解决。但是缺点也很明显:上限很低,在执行复杂的驾驶任务的时候,会有明显的机械感,某些时候还需要人工接管。

而端到端就是一端传感器输入信息,另一端直接输出行驶指令。将感知、预测、规划这些原本分开的流程,整合为统一的大模型,并进行全部计算。去掉了信息在流水线上传递这一过程,误差和延迟都大大减少。

只需要一个模型(one model),就能把摄像头、毫米波雷达、激光雷达等传感器收集到的感知信息,转换为方向盘的转动方向和角度、加速踏板的踩踏深度等具体的操作指令。通过大量的数据训练,不需要写规则,也不需要处理极端场景,可以做到拟人驾驶,这种技术大幅提升了智驾系统的上限。

小米表示,目前主流的端到端大模型是生成式大模型,直接生成一条执行轨迹,如果训练不到位,就会出现很多莫名其妙的幻觉,这也是我们说的下限很低。

而小米的智驾对端到端的运行方式有着独到的思考,从模仿轨迹转为筛选轨迹。大模型首先实时生成所有合理的行驶轨迹,进而逐一考量安全、舒适、合规、效率等各方面因素,选择最优解并执行。

在全面接入端到端大模型后,车辆的行驶轨迹更拟人,更加平滑、自然,急加速和急刹车明显减少。除此之外,车辆还可以根据公交车道的限行情况,智能预判,并规划最佳行驶路径,提前做出更合理的驾驶决策。

接入端到端大模型的小米智能驾驶还可以做到ETC、闸机卡口通行,车位到车位,全程无断点。卡口前智能降速,灵活等待;进出口机智识别,精确选择;抬杆后即刻起步,高效利索。

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,274863人围观)参与讨论

还没有评论,来说两句吧...