智能驾驶行业的竞争重心正在经历第三次切换。早期比拼激光雷达、摄像头数量与算力TOPS;随后进入大模型时代,端到端、VLA(视觉-语言-行为模型)、World Model(世界模型)成为焦点;而如今,更大的模型已不足以构成代际优势,真正的上限取决于模型、数据、算力与芯片之间能否形成持续迭代的闭环。 这一趋势下,越来越多车企走向自研。特斯拉已覆盖从数据采集到FSD模型、Dojo超算与自研芯片的全链条;国内,小鹏、蔚来、理想也纷纷向底层延伸。理想汽车在2025年发布的L8、L9车型上搭载了自研的马赫M100芯片,并跑通了自研的马赫VLA模型。 近日,理想汽车自动驾驶负责人詹锟与芯片负责人谢炎接受了媒体采访,首次详细阐述了理想对下一代自动驾驶技术路线的判断,以及自研芯片、数据体系与AI基础设施的设计逻辑。 追赶FSD V14的两层目标 当被问及“四季度达到特斯拉FSD V14效果还需哪些工作”时,詹锟表示,追赶FSD需从两个层面入手。第一是基础体验,包括安全感、效率与舒适度,FSD在这三方面基本功扎实。第二是能力层面,例如礼让特殊车辆、极窄通行感知、识别交警指挥等,这些能力背后涉及架构与数据的深层次原因。“为什么别人没有,只有特斯拉有?可能是以前的范式限制了这些能力。”詹锟说,理想已在架构层面做了大量尝试。 VLA与语言模型:走向L3/L4的必经之路 詹锟指出,当前自动驾驶架构的共同趋势是将VLA与World Model整合。“从长远看,没有谁不往这个方向走。”他解释,无论VLA还是World Model,其中的Prompt都需要语言参与。基于视觉的感知对空间理解更合理,但语言在理解环境、交通规则与复杂决策方面不可或缺。“基于Vision和Language原生的基础模型,可能是长远的未来趋势。” 谢炎进一步补充,若要走向L3、L4,模型需具备人类般的思考能力,而语言模型正是这种能力的来源。“比如警察做手势,你要理解是让你走还是不让你走,这不是靠收集或生成数据能解决的。”他认为,语言的重要性将愈发突出,这也需要更大算力支撑。 数据边际效应:对数曲线下的效率提升 随着理想车队规模跃升,数据的边际效应是否衰减?詹锟承认,模型能力向100分迈进时,数据收益呈对数曲线递减,但理想希望通过规模加速收敛。他定义“价值数据”需满足两点:量足够大以覆盖更多Corner Case,以及行为质量高——在端到端范式下,动作的干净度与一致性至关重要。特斯拉在车端部署neural trigger筛选关键数据,正是其强项之一。 自研芯片:从数据流架构到车内AI计算中心 马赫M100采用数据流架构,被理想视为for AI的重要方向。谢炎解释,该架构对带宽要求较低,但设计并非仅由单一指标决定。“计算、带宽、SRAM都需要晶体管代价,最终是成本与综合性能的平衡。”他强调,仅凭一两个指标对比芯片架构既不合理也不专业。 关于舱驾融合,谢炎明确表示,高端智驾(L3/L4)需要高确定性系统,内存与计算资源需专属,融合反而降低效率。“越往后走,舱驾融合意义不大。”理想的最终形态是车内一个AI计算中心,所有AI任务集中处理,通过Token Server实现高效分配与任务隔离。 自研芯片的条件:营收规模与产品能力 芯片前期投入巨大,一年可能需数亿元。谢炎指出,车企需达到千亿级营收规模,且每年研发投入占比至少10%,才有能力持续投入。此外,自研芯片必须能增强产品竞争力。他反驳了“芯片需大规模出货才能摊薄成本”的观点,以马赫M100为例,两片芯片面积约800平方毫米,相当于8台高端手机芯片,大几十万辆车的晶圆面积足以摊薄成本。 编译器与数据流:超大规模并行调度难题 马赫M100的编译器在流片前就已开始开发,甚至在设计阶段就运行了多个模型。数据流架构类似于超大规模计算机集群的调度问题——当核数达百万级时,传统冯·诺依曼架构的中央调度方式不可行,需要全新的并行调度方案。谢炎表示,这是团队攻克的核心难点之一。 行业视角 智能驾驶的竞争已从单点技术比拼转向系统级闭环能力。理想汽车通过自研芯片、VLA模型与数据体系,试图构建类似特斯拉的垂直整合优势。尽管追赶FSD V14仍需时日,但其对技术路线的判断与投入逻辑,为行业提供了新的参考坐标。对于关注AI与自动驾驶的从业者而言,如何平衡自研投入与产品落地效率,将是持续考验。

文章来源:https://aidadog.com/news/l8brxi3m68ga8ti6fpgq1d0l





