Runway发布通用世界模型GWM-1：AI创作理解世界新篇章

2025-12-15 14:07

181

美国创意AI公司Runway于2025年12月发布了其首个通用世界模型（General World Model,GWM）——GWM-1。该模型号称能够实时构建理解物理定律和时间演化的动态模拟环境，通过逐帧预测生成可交互的虚拟世界！

Runway表示，GWM-1的推出使公司与谷歌、Meta等在AI模拟领域展开竞争，标志着AI从文字和图像生成迈向模拟现实世界的新阶段。

GWM-1（General World Model-1）是Runway首个通用世界模型，旨在通过“逐帧像素预测”模拟现实世界的物理规律与时间演变，帮助AI在无需真实场景训练的情况下进行推理、规划与操作。其核心特点是自回归性（逐帧生成），允许用户在任何时刻干预场景（如移动视角、控制物体），模型会实时模拟后续结果。

GWM-1目前包含三个子模型，覆盖不同应用场景：

1.GWM-Worlds：可探索环境的交互式模拟器

功能：用户通过文字提示或图像设定场景（如“城市街道”“雪山仓库”），模型生成具备几何、物理、光照理解的虚拟世界，以24帧/秒、720p分辨率运行。

应用：可用于游戏开发（创建沉浸式场景）、AI代理训练（让AI学习在现实世界中导航、避障）。例如，指令AI“骑自行车”，它会稳稳行驶在地面上；指令“飞行”，它能自动调整轨迹。

2.GWM-Robotics：机器人训练的学习型模拟器

功能：基于机器人数据训练，支持反事实生成（探索不同动作的结果，如“机器人碰到障碍物会怎样”），并能模拟天气变化、动态障碍物等变量。

应用：为机器人企业提供合成数据（无需昂贵真实数据采集），扩充训练数据集；支持策略模拟评估（直接在模型中测试机器人策略，如避障、抓取），比真实测试更安全、高效。Runway已发布GWM-1 Robotics SDK（Python接口），支持多视角视频生成与长上下文序列，方便企业集成。

3.GWM-Avatars：音频驱动的交互式数字人

功能：通过音频驱动，模拟逼真或风格化角色的自然动作与表情（如面部表情、眼球运动、口型同步、手势），支持长时间对话（质量不下降）。

应用：覆盖教育（虚拟导师讲解概念）、客户支持（虚拟客服回应问题）、培训（模拟谈判场景）、娱乐（游戏角色互动）等领域。例如，虚拟导师能根据学生的问题做出自然反应，提升学习体验。

Runway表示，这三个子模型目前技术独立，但未来计划整合为一个统一的通用世界模型，实现跨领域（如环境、角色、机器人）的模拟能力。

好文章，需要你的鼓励