Runway发布通用世界模型GWM-1:AI创作理解世界新篇章
美国创意AI公司Runway于2025年12月发布了其首个通用世界模型(General World Model,GWM)——GWM-1。该模型号称能够实时构建理解物理定律和时间演化的动态模拟环境,通过逐帧预测生成可交互的虚拟世界!
Runway表示,GWM-1的推出使公司与谷歌、Meta等在AI模拟领域展开竞争,标志着AI从文字和图像生成迈向模拟现实世界的新阶段。


GWM-1(General World Model-1)是Runway首个通用世界模型,旨在通过“逐帧像素预测”模拟现实世界的物理规律与时间演变,帮助AI在无需真实场景训练的情况下进行推理、规划与操作。其核心特点是自回归性(逐帧生成),允许用户在任何时刻干预场景(如移动视角、控制物体),模型会实时模拟后续结果。
GWM-1目前包含三个子模型,覆盖不同应用场景:
1.GWM-Worlds:可探索环境的交互式模拟器
功能:用户通过文字提示或图像设定场景(如“城市街道”“雪山仓库”),模型生成具备几何、物理、光照理解的虚拟世界,以24帧/秒、720p分辨率运行。
应用:可用于游戏开发(创建沉浸式场景)、AI代理训练(让AI学习在现实世界中导航、避障)。例如,指令AI“骑自行车”,它会稳稳行驶在地面上;指令“飞行”,它能自动调整轨迹。
2.GWM-Robotics:机器人训练的学习型模拟器
功能:基于机器人数据训练,支持反事实生成(探索不同动作的结果,如“机器人碰到障碍物会怎样”),并能模拟天气变化、动态障碍物等变量。
应用:为机器人企业提供合成数据(无需昂贵真实数据采集),扩充训练数据集;支持策略模拟评估(直接在模型中测试机器人策略,如避障、抓取),比真实测试更安全、高效。Runway已发布GWM-1 Robotics SDK(Python接口),支持多视角视频生成与长上下文序列,方便企业集成。
3.GWM-Avatars:音频驱动的交互式数字人
功能:通过音频驱动,模拟逼真或风格化角色的自然动作与表情(如面部表情、眼球运动、口型同步、手势),支持长时间对话(质量不下降)。
应用:覆盖教育(虚拟导师讲解概念)、客户支持(虚拟客服回应问题)、培训(模拟谈判场景)、娱乐(游戏角色互动)等领域。例如,虚拟导师能根据学生的问题做出自然反应,提升学习体验。
Runway表示,这三个子模型目前技术独立,但未来计划整合为一个统一的通用世界模型,实现跨领域(如环境、角色、机器人)的模拟能力。
