VLA自动驾驶模型迈入市场化分析
摘要
VLA(Vision-Language-Action)是一种整合视觉、语言与行动的多模态AI架构;VLA模型一开始是在机器人领域受到广泛讨论,但由于该架构的泛化性与平台可迁移性高,自动驾驶领域也有许多厂商投入开发。2025下半年VLA模型已被用于量产车上,证明其在自动驾驶领域的价值。本篇报告主要探讨VLA模型用于自动驾驶的优势、遭遇到的挑战,以及讨论主要开发商与车厂的动态。
一. VLA模型提升可解释性,但须大运算力支援
二. VLA模型的供应商以中国厂商最快实现装车
三. 理想与小鹏自主开发VLA模型
四. 拓墣观点
图一 理想汽车AI推理可视化
图二 Waymo EMM模型示意图
图三 Wayve LINGO-2
图四 元戎启行VLA模型域控制器产品展出
图五 理想汽车的端到端架构演变
图六 小鹏云端与车端模型架构
表一 不同自动驾驶模型的比较
