记录一下车展期间 Momenta CEO 曹旭东的分享。
- 关于辅助驾驶供应商的竞争。
智驾或者整个自动驾驶它有非常强的规模效应和先发优势,它的效应会比芯片行业更强。
所以你回顾历史可以看到,这个芯片行业,不管是 PC 时代的芯片,实际上全球就只有两家,手机芯片的时代全球也就只有两家,高通和 MTK。
自动驾驶,因为它是软件,它的边际成本是零,所以它的规模效应更强,它的规模效应除了成本上的规模效应,还有体验上提升的规模效应。
另一方面,面向主机厂有特别强的先发优势,因为主机厂很多业务都是敲门敲三年,从你见到客户到拿下合同是 3 年,如果是国际 OEM 的话,可能要敲门敲 5-7 年。
我拿奔驰举例子,我们中间 2017 年到 2020 年是 POC,2020 年到 2022 年是 Pre SOP,2022 年到 2024 年是小批量的量产开发,到了 2024 年才拿到了奔驰所有的电车和油车的业务,2025 年底的时候才真正的量产。
所以举一个例子可以感受到,汽车行业敲门敲 3 年,国内的 OEM 敲门敲 3 年,海外的OEM敲门敲 5-7 年。
这个行业有非常强的规模效应和非常强的先发优势,所以我还是维持我原来的判断,中国也就 2-3 家,全球也就 3-4 家,会非常快速地收敛。
- 关于物理 AI 的判断。
物理 AI 我觉得最核心的,一个是数据闭环,一个是商业闭环,而且这两者是互动的。
我有一个经验,这个经验就是,任何一个人工智能的应用,一旦接近人类的水平,就会在很短的时间大幅超过人类的水平,这背后的逻辑是什么呢?
仅仅是我的一个观察,就比如说你看 Alpha Go 也好,或者过去的人脸识别也好,前面经过了一个非常漫长的爬坡期去接近人,接近人可能花了十年、二十年很长的时间。
但是超越人,或者大幅地超越人,有可能就发生在 1、2 年,2、3 年的时间,一开始有这个观察之后,我就在想背后的原因到底是什么?
后来就觉得最关键的还是数据闭环和商业闭环,而且这两者之间是正反馈的,因为先有了数据闭环,然后才有足够好的体验,这个足够好的体验一旦达到了接近人类的水平或者超过人类的水平的时候,就能够实现爆发式的商业化。
而这个爆发式的商业化之后,又会带来数据爆发式的增长,而数据爆发式的增长又会带来模型能力进一步的爆发式增长,最终能够互相促进、互相激发,形成强烈的正反馈,而强烈的正反馈使得在很短的时间内就能够实现十倍、百倍甚至千倍人类的经历。
我们的判断就是自动驾驶进入到了这个阶段,机器人还需要一段时间,这是第一点。所以自动驾驶是物理 AI 的序章,因为它最先实现了规模的数据闭环和规模的商业闭环。
第二点就是,你看自动驾驶要实现规模化的 L4,我的判断累计的投入至少是百亿美金,而且有可能还是创业公司的研发效率,如果你是大公司的话不只是百亿美金,可能需要几百亿美金。
但是机器人呢?通用的机器人它需要多少钱?我的判断可能是几百亿美金到千亿美金这个级别,有可能还是创业公司的研发效率。
所以我的判断就是,物理 AI 它是需要有门票的,而这个门票就是你需要有现金流的业务,虽然现在整个中国具身智能的资本市场是非常活跃的。
但是长期来看,要靠投资,要靠融资,追踪做成通用的物理AI,或者物理世界的AGI是不现实的,而是一定要有现金流业务,而这个现金流业务可以是自动驾驶,也可以是物理 AI 某一个方向。
虽然我现在没有想到,其他的某一个方向能够更早地实现规模化的数据闭环和商业闭环,或者其他来自于数字AI的现金流业务。无论如何一定要有一个现金流业务来支持物理 AI 的研发。
- 关于技术路线的选择和壁垒。
更重要的不是单点算法,是架构能力,架构能力已经比单点算法能力更强了,因为一旦涉及到架构一定涉及到取舍,不是所有的创新都能放到同一个架构里面。
涉及到架构的话就涉及到取舍,好的架构能够实现更好的积累和更好的合力,架构之上又包含了体系,这个体系包含了数据迭代的体系,包括了训练的体系,也包括了整个迭代的体系和验证的体系,体系之上更多的是组织和文化,
在中国的环境下,知识的流动和人才流动的速度其实是比较快的,仅仅是单点算法的话,并不存在特别大的壁垒或者差异性,有壁垒的是体系和组织的能力。
所以你会发现,可能大家说的都是同样的单点算法的方向,但是最终做出来的效果可能有一代或者两代的差距,背后不是单点算法的差距,背后是体系和组织的差距。
- 关于辅助驾驶技术接下来的发展。
预测是智能进化的核心基石:大语言模型依托 Next Token Prediction,压缩数字世界常识,让 AI 具备了文本和自然语言理解的能力;
而世界模型,则通过 World Model Prediction,预测物理世界未来的状态和交互逻辑,获得理解物体的物理属性、运动的因果关系、交互的潜在可能。
Momenta 的世界模型分为三个层次:第一层,世界模型预训练。通过海量真实驾驶数据的预训练,将物理规律、常识与因果关系压缩进模型,使系统形成对物理世界的基础认知;
第二层,世界模型仿真。将世界模型用于自动驾驶的闭环仿真,让系统能够推演自身行为变化时世界将如何演变,依托高效场景推演能力,对长尾场景进行性能评估;
第三层,在世界模型中进行强化学习。
2026北京车展
