Runway发布Gen-4.5:视频质量与物理一致性再刷新纪录
12月2日消息,AI视频创业公司Runway正式发布新一代视频生成模——Gen 4.5。据独立评测榜单显示,该模型已经登上全球视频AI榜单第一名,排名超过Google与OpenAI。
Gen 4.5在视觉准确性和创意控制方面相比之前版本有了显著提升,致力于为用户提供更高质量的高清视频生成体验。用户只需输入简短的文本提示,就可以生成符合需求的动态视频,涵盖复杂的场景与生动的人物角色。
Gen 4.5支持用户通过文字描述生成高清动态视频,并在动作表现、物理效果、人物运动、镜头运动以及因果逻辑理解上有显著提升。

该模型登顶的榜单——Video Arena由独立AI评测机构Artificial Analysis维护,评测方式为用户盲测投票,最终由真实使用者决定排名。
目前,Google Veo 3位列榜单第二,OpenAI的Sora 2 Pro排在第七。
Gen-4.5采用Nvidia GPU进行预训练、后期训练以及推理,使得视频生成的精度和风格控制达到了新的高度。根据市场分析师Arun Chandrasekaran的观点,尽管Runway在视频生成领域不断进步,但其面临着来自OpenAI的Sora和谷歌的Veo3.1等竞争对手的挑战。
值得注意的是,Gen-4.5主要针对社交媒体短视频的创作,适合用于Instagram等平台,而谷歌的Veo则更倾向于制作长达数分钟的产品营销视频。尽管面临不同的市场需求,Runway的Gen-4.5在物体和角色的一致性质量上做出了很大改善,尤其在重现复杂视频场景方面表现突出。
Runway联合创始人兼CEO Valenzuela在接受采访时表示:“我们用一支100人的团队击败了几家市值万亿美元的巨头。”
这款模型内部代号为“David”,寓意与巨头对抗的“大卫与歌利亚”故事。Valenzuela称它是“一夜爆红,但研发花了七年”。
Runway近年来发展迅速。公司成立于2018年,今年入选CNBC Disruptor 50名单,并拥有包括媒体公司、电影工作室、品牌、设计师与学生在内的多元客户群。根据PitchBook数据,目前公司估值已达到35.5亿美元。
Valenzuela认为,Gen 4.5的发布标志着AI行业的结构性变化:
“我们正在进入一个效率与研发驱动的时代。AI不该被两三家公司垄断。”
Gen 4.5将以渐进方式向用户开放,并将在本周向所有Runway客户全面上线。该模型将通过Runway的产品平台、API,以及合作伙伴渠道持续提供服务。
Runway的Gen-4.5模型也暴露出一些限制。例如,它在因果推理方面表现不佳,有时会出现效果先于原因的情况,或物体在时间上不连贯等问题。尽管如此,Runway在记忆和物体互动的改进上依然在不断努力,期待未来能够推出更加持久和一致的视觉效果。
