2026 年全球 AI 产业正从数字内容向物理世界延伸,世界模型成为行业新的技术制高点。继英伟达、特斯拉、谷歌等全球巨头密集布局后,中国自动驾驶企业 Momenta 近日通过港交所聆讯,凭借 R7 世界模型实现规模化量产上车,成为物理 AI 赛道的标杆企业,也标志着自动驾驶正式从模仿学习迈入世界模型驱动的新阶段。
一、行业拐点显现:世界模型成物理 AI 核心基座
过去十年自动驾驶主流路线为模仿学习,通过复刻人类司机的驾驶动作实现辅助驾驶,但天然存在天花板 —— 只能学到 “做什么”,无法理解背后的物理因果,能力上限无法超过人类司机。
而世界模型的核心逻辑是通过预测下一帧画面习得物理规律,如同大语言模型通过预测下一个词掌握语言逻辑,是物理 AI 的通用技术底座。
2026 年以来,全球科技界已形成明确共识:杨立昆创办 AMI Labs 押注 JEPA 架构,李飞飞创立的 World Labs 获高额融资,谷歌将世界模型深度融入 Gemini 体系。 数字 AI 已催生万亿美元市场,而物理世界的产业空间更为广阔,自动驾驶则是世界模型最先落地、商业闭环最清晰的场景。
二、R7 三层架构:量产数据驱动物理规律习得
Momenta 的 R7 世界模型是全球少数实现量产落地的方案,采用三层递进的技术体系。
第一层为大规模预训练,依托 90 万辆量产车、超 100 亿公里实车里程,提炼 1 亿段高质量黄金数据,让模型习得惯性、运动、碰撞等底层物理规律,从根源理解驾驶逻辑而非单纯复刻动作。
第二层为仿真生成,世界模型可自主生成各类极端驾驶场景,通过实车数据校准虚实差异,将极端场景的训练效率提升上万倍,解决了实车路测稀有场景样本不足的行业痛点。
第三层为强化学习,在仿真环境中通过奖惩机制自主迭代策略,在物理规则约束下寻找最优驾驶方案,实现能力超越人类司机的进化。目前中国城区领航辅助车辆中,65% 采用 Momenta 的技术方案,全球前十大车企中有九家为其客户,落地规模处于全球第一梯队。
三、多场景复用:构建正向循环的数据飞轮
行业发展经验表明,单一自动驾驶场景难以支撑长期商业化。
Momenta 基于世界模型的通用物理理解能力,打造 All-in-One 技术平台,一套底座同时覆盖乘用车 L2++、Robotaxi、Robovan、Robotruck 四大场景,实现技术能力的跨场景复用。
这套布局形成了稳固的数据飞轮:乘用车海量日常里程为模型提供基础数据,Robotaxi 的极端场景反哺提升全场景安全性;模型迭代后通过 OTA 推送至量产车辆,更优的产品吸引更多 OEM 客户,进一步扩大数据规模。目前公司技术许可收入三年增长 42 倍,七家互为竞争对手的车企均成为其股东,印证了行业对其技术的认可度。
据机构测算,2030 年全球智驾与无人物流市场总规模将超 5000 亿美元。
四、对标 Anthropic:打造物理 AI 平台级企业
从产业路径看,Momenta 与数字 AI 领域的 Anthropic 高度相似。Anthropic 以编程场景为切入点,凭借清晰的对错标准、快速反馈循环跑通商业化,再向金融、医疗等领域拓展;Momenta 则以自动驾驶为锚点,依托明确的安全验证标准、海量实时数据反馈、成熟的量产业务闭环站稳脚跟,再将物理世界理解能力复制到更多场景。
与纯软件 AI 公司不同,Momenta 构建了软硬一体的壁垒:量产车队是稳定的数据入口,深度绑定的 OEM 生态是核心护城河,OTA 体系是持续迭代的通道,壁垒比纯 API 模式更加深厚。随着公司登陆资本市场,物理 AI 的规模化落地节奏有望进一步加快,属于物理世界的 “GPT 时刻” 正加速到来。