Runway 推出 Gen 4.5:小团队逆袭,AI 视频模型测试超谷歌、OpenAI

2026-01-22 14:15
139
AI初创企业Runway正式发布视频生成模型Gen 4.5,在第三方盲测基准中综合表现登顶,小幅超越谷歌Veo 3与OpenAI Sora 2 Pro,成为AI视频赛道的黑马选手。

一、公司核心背景
成立于2018年,专注AI基础研究、视频大模型及世界模型开发,团队仅约百人,估值达35.5亿美元。
投资方包括General Atlantic、Baillie Gifford、英伟达、Salesforce Ventures等知名机构。
客户覆盖主流媒体、影视公司、国际品牌、设计师、独立创作者及高校学生,应用场景广泛。
二、Gen 4.5核心优势
物理机制理解升级:精准模拟液体流动、材质反光、发丝摆动等微观动态,解决过往AI视频物体移动突兀、光影错乱等问题,保障画面连贯性与自然感。
视觉与可控性提升:支持文本生成高分辨率视频,人物面部无变形、物体无凭空增减,帧间过渡平滑,在运动逻辑、镜头调度、因果链条理解上显著进步。
风格适配灵活:可输出电影级胶片质感影像与写实风格动画,部分指标逼近专业影视工业水准。
技术突破:优化预训练效率与后训练算法,重新定义时间一致性与动作可控性的行业标准。
三、测试表现与评测机制
在Video Arena Elo排行榜中,Gen 4.5以1247分登顶,小幅领先谷歌Veo 3(1226分)、OpenAI Sora 2 Pro(1206分),属微弱优势非压倒性胜出。
采用双盲测试机制,用户仅依据观感投票,无法识别视频来源,确保评估结果客观公正。
四、研发合作与现存挑战
与英伟达深度协同,依托Blackwell与Hopper架构GPU完成训练与推理。
仍有阶段性问题待解:个别场景因果推理偏差、长时序物体持续性不足、存在“成功偏置”(如箭矢必中靶心的过度理想化)。
五、上线计划与行业影响
已启动分阶段上线,本周内全面向所有Runway注册用户开放,后续将推出功能更新,服务涵盖自有平台、开发者API及战略合作伙伴渠道。
研发代号“David”,象征小团队向科技巨头发起挑战,推动生成式AI走向开放多元,为行业注入动能,也警示国内厂商需聚焦核心技术攻坚,避免低水平内耗。
0
好文章,需要你的鼓励