追赶FSD V14,理想在补哪些课?|最前线 - 糖果派对APP
- 游戏资讯
- 3条评论
过去几年,智能驾驶领域的竞争焦点经历了显著转变。起初,竞争围绕硬件展开,包括是否配备激光雷达、安装多少摄像头以及算力要达到多少 TOPS。随后进入大模型时代,竞争转向了端到端、VLA(视觉-语言-行为)、World Model(世界模型)等技术路线。
如今,越来越多的企业认识到,拥有更大的模型已不足以形成代际优势。真正决定技术上限的,开始转变为模型、数据、算力和芯片之间能否构建一个持续迭代的闭环。这也解释了为何越来越多的汽车制造商选择自主研发。
特斯拉几乎垄断了从数据采集、训练基础设施、FSD模型到Dojo、自研芯片的整个链条。在中国,小鹏、蔚来以及理想汽车都在不断向下游的底层技术延伸。理想汽车在其今年发布的 L8 和 L9 车型上,已经采用了自研的马赫 M100 芯片。这款采用数据流架构的芯片被理想视为人工智能领域的重要技术方向。基于马赫 M100,理想也运行了自研的马赫 VLA 模型。
然而,对于整个行业而言,更值得关注的并非“是否自研”,而是这些投入究竟能解决哪些实际问题。
带着这个疑问,我们采访了理想汽车自动驾驶负责人詹锟和芯片负责人谢炎。他们就理想对下一代自动驾驶技术路线的判断,以及自研芯片、数据体系和AI基础设施背后的设计理念进行了阐述。以下为访谈的部分内容摘要,经过编辑整理:
问:到第四季度,为了达到特斯拉 FSD V14 的效果,理想汽车还需要在哪些方面努力?
詹锟: 我认为追赶 FSD 有两个层面。
首先是基础体验,具体体现在三个方面:安全感、效率和舒适度是否能达到 FSD 的同等水平。FSD 在安全感方面表现出色,效率高,舒适度也很好,这是其基本功。即使不处理极端复杂的路况,也能达到这个基本水平。
其次是能力层面,这同样难以追赶。例如,特斯拉能够礼让特殊车辆,在极窄通道通行时的感知精度极高,并能识别交警的指挥手势,这些能力非常强大。
能力方面存在架构升级的机会。为什么其他公司没有而特斯拉拥有这些能力?可能是过去的技术范式限制了这些能力的实现,这与架构和数据都有关。我们在这一层面做了大量尝试。
问:我理解马赫 VLA 是一个技术体系,而非单一模型。例如,Mind-Edge 是服务于智能座舱的端侧模型。那么,当前智能驾驶模型中是否还包含“L”(Language,语言)的部分?
詹锟: 当前自动驾驶的架构普遍趋向于将 VLA(视觉-语言-行为模型)与 World Model(世界模型)整合。
从长远来看,所有技术路线都会朝着这个方向发展。无论是 VLA 还是 World Model,其内部的 Prompt(提示)都离不开语言。因此,语言部分是必然存在的,关键在于如何应用语言。
对于机器智能,我认为基于视觉(Vision Based)是更合理的方式,它能更好地理解空间、三维空间感知以及与环境的交互。语言当然也有其价值,在理解环境、交通规则、指令以及进行复杂思考和决策时都非常有益。
从长远来看,基于视觉和语言的原生基础模型,可能是未来的发展趋势。
谢炎: 如果要实现 L3、L4 级别的自动驾驶,解决更广泛的问题,模型就需要具备类似人类的思考能力。届时,语言的重要性将日益凸显,这也是未来需要巨大算力的原因。
如果模型仅具备视觉和动作(Vision and Action)能力,即使拥有大量数据,在遇到分布外的场景时也会束手无策。就像动物即使学会了所有常见情况,面对从未见过的情形也完全不知所措,无法做出正确的选择。
我们认为,越是朝着 L3、L4 级别发展,解决的问题越是接近 90%、95%、98% 之后的那些未知场景,这就需要模型具备类似人类的思考能力。而获得这种推理和思考能力,语言模型是关键。例如,理解交警的手势意图,是让你通行还是停止,这并非仅仅通过收集或生成数据就能解决的问题。
问:随着理想汽车车队规模的扩大,从内部来看,数据的边际效应是否出现了衰减?你们是如何定义有价值的数据的?
詹锟: 首先,数据的数量必须足够庞大,本质上是为了收集更多的 Corner Case(长尾场景)。目前,业界有多种方法可以在车端部署高效的 neural trigger(神经网络触发器),以判断场景的难易程度,并将关键数据回传。这也是特斯拉在这一领域表现出色的重要原因之一。
其次,数据质量必须高,主要体现在行为质量上。目前,业界逐渐趋向于端到端的范式,无论是 VLA(视觉-语言-行为模型)、World Model(世界模型)还是 Vision-Action(视觉-动作模型),都可以采用。但关键在于必须准确理解 Action(行为),此时行为的质量就显得尤为重要,包括行为的清晰度和一致性。
至于数据规模扩大后边际效应是否衰减,首先,只要模型不断提升,只要我们朝着满分的目标迈进,其增长曲线必然是对数型的,呈现缓慢衰减的趋势,不可能呈线性增长,这是所有 AI 公司面临的普遍情况。尽管后期数据收敛的速度确实会放缓,但我们希望通过规模效应来加速这一过程。
问:马赫 M100 可以在不同的 AI 场景下运行。五年后,或者再往后两代产品,理想汽车车内的算力中心是否有可能完全采用自研的马赫芯片?
谢炎: 尽管业界存在“舱驾一体”的说法,但我们认为舱驾一体的核心在于 AI 算力部分,其他部分的整合并非那么关键。因为座舱系统和 AI 智能驾驶系统可以完全独立运行,而 AI 算力则可以集中处理,从而大大提高效率。
我们设想的最终形态是车内构建一个统一的 AI 计算中心,所有 AI 任务都可以在这个中心进行计算。这类似于在笔记本电脑上运行 OpenClaw,AI 计算并非直接在笔记本上完成,而是通过 Token Provider Server(Token 供应服务器)实现,车内也类似,会有一个 Token Server(Token 服务器)。
这个 Token Server 的优势在于:第一,效率极高。第二,能够实现不同任务的相互隔离,互不干扰。例如,智能驾驶任务的确定性,包括内存和带宽,能够得到保障,不被其他任务影响,这是软硬件协同设计才能实现的结果。
问:是否因为马赫 M100 采用了数据流架构的 AI 推理芯片,所以相比其他厂商的自动驾驶芯片,其对带宽的需求较低,而对片上存储的需求更高?
谢炎: 我们对带宽的要求确实会相对较低,但这并非设计 SRAM 容量(而非显存)的直接原因。当前 HBM(高带宽内存)非常流行,很多人认为带宽越高越好。但计算、带宽、SRAM 等都需要晶体管资源来实现,最终的设计是基于成本、综合性能等多方面权衡的选择。
不同的架构设计,不能仅仅依靠一两个指标进行简单对比,这既不合理也不专业。这就像拳击比赛,身高和体重都有各自的优势,但胜负并非由单一指标决定,最终比拼的是整个比赛的结果。
问:为什么当前的大算力芯片方案,如英伟达、小鹏、理想自研的芯片,都没有实现芯片级的舱驾融合,而高通却在低算力芯片上实现了这一点?这是为什么?
谢炎: 从本质上讲,座舱和驾驶是两个独立的系统。特别是对于高端 L3 向 L4 级别的自动驾驶,智能驾驶需要一个更高确定性的系统,内存和计算资源需要专属化,此时融合的意义就大大降低了。因为资源无法实时切换,实时切换会降低确定性。如果朝着越来越独占的方向发展,融合的价值就不大了——仅仅是将芯片集成在一起,但资源仍然是独立的,并不能带来成本的降低,甚至可能影响效率。
您可以看到,当前的舱驾融合系统,它们仍然是分开的。无法实现“一会儿运行这个,一会儿运行那个”的场景切换。在这种情况下,将两个芯片集成在一个芯片上,晶体管数量可能不变,仅仅节省了封装成本。对于中低端芯片来说,这部分成本可以节省,但节省的幅度也有限。
我的观点是,随着智能驾驶的日益高端化,舱驾融合的意义可能并不大。如果将这些芯片做得更近,例如在一块电路板上实现高度集成化的方案,这是可行的,不一定非要集成在一块芯片上,也可以是多块芯片组合在一起。
问:自研芯片需要具备哪些条件,例如销量、营收和研发投入?当前自动驾驶迭代速度很快,芯片要持续迭代需要哪些条件?
谢炎: 芯片的前期投入确实不菲,可能每年需要数亿元。
第一个条件是达到一定的营收规模。对于汽车制造商而言,年营收达到 1000 亿元以上,研发投入至少占 10%,即每年有几十亿到上百亿的资金,这样才有能力持续投入芯片研发。第二个条件是,你研发的芯片所解决的问题,必须能够显著提升你的产品能力。
很多人认为芯片需要很大的出货规模才能实现成本摊薄。实际上,芯片的成本与面积密切相关。一辆车上的智能驾驶芯片,例如 Livis 使用两颗马赫 M100,总面积约为 800 平方毫米。而一部高端手机芯片的面积大约为 100 平方毫米,因此一辆车的智能驾驶芯片面积相当于 8 部手机的芯片面积。
这样计算下来,几十万辆车的出货量所需的晶圆面积非常庞大,足以摊薄成本。所以,成本不能仅仅用芯片的数量来衡量。
问:动态数据流编译器究竟难在哪里?花了多长时间才攻克?
谢炎: 在流片之前,甚至在设计阶段,我们就已经开始进行编译器工作了,在流片前,已经完成了许多模型的运行验证。
数据流是一种完全不同的架构,它需要解决的问题非常类似于超级计算机或大规模计算机集群所面临的挑战——当规模扩展到几十万台计算机、上百万个核心时,它们之间的通信和协作,无法依赖一个中央管理员来统一管理。传统的冯·诺依曼架构调度方式在这种规模下是不可行的,这是一个超大规模的并行调度问题。
糖果派对专注热门玩法介绍,点燃游戏激情,为用户提供专业可靠的体验。
糖果派对深耕糖果派对在线试玩领域,用心服务每一位用户。
在糖果派对娱乐平台方面,糖果派对提供贴心周到的支持。
05条评论
糖果派对专注糖果派对在线试玩,为用户提供专业可靠的体验。
艾米莉·布朗特
2017年12月4日 下午3:12
围绕糖果派对娱乐平台,糖果派对持续打磨更优质的服务。
艾米莉·布朗特
2017年12月4日 下午3:12

精选活跃社区互动,结识游戏伙伴内容,糖果派对与你一同发现更多精彩。
艾米莉·布朗特
2017年12月4日 下午3:12