快手即将发布Kling Omni视频生成模型:挑战 OpenAI 的 Sora
快手科技旗下 Kling AI 于本周正式开启“Kling Omni Launch Week”,标志着其最新多模态视频基础模型 的全球发布。这一创新产品旨在构建“全能创意宇宙”,通过统一的多模态视觉语言(MVL)框架,实现视频生成与编辑的无缝融合。
Kling Omni视频生成模型
Kling Omni 的核心在于提供“导演级”的控制能力。它支持文本、图像和视频的多输入参考,允许用户对视频内容进行精确调整,例如“保留主角形象,切换金色时段光线并移除背景车辆”。
相较于前代产品,Kling O1在以下方面取得了显著提升:
时长与连贯性:可生成长达2分钟的连续视频,并增强了运动稳定性和风格连贯性。
原生音频同步:集成了原生音频同步技术,确保声音与画面达到帧级精确匹配。
Kling 系列模型目前已服务全球4500万用户和2万家企业。本次发布被业内专家视为 AI 视频领域的一次革命性跃进,预示着 AI 视频创作将从“随机生成”转向“程序化导演”模式,这将极大地助力影视、广告和游戏产业的高效创作,并进一步推动生成式 AI 向专业应用深度渗透。

Kling 是什么?
Kling 是快手推出的一款全新 AI 视频生成器。
Kling 可以以 1080P 分辨率和自由宽高比生成长达120 秒、每秒 30 帧的视频。据其创建者称,他们的 AI 模型可以更好地理解物理并准确地模拟复杂的运动。Sora 需要八个 NVIDIA A100 图形处理单元 (GPU) 运行三个多小时才能制作出一分钟的视频,一台 NVIDIA A100 的价格超过 10,000 美元。Kling 需要多少计算能力才能制作出 2 分钟的视频,还不知道。
从其创建者展示的示例来看,Kling 是一款令人印象深刻的 AI 模型。它比 Sora 更好吗?在某些情况下,确实如此。但 Sora 几个月前才发布,此后可能已经做出了改进,但 OpenAI 尚未公布。它比 Google 的 Veo 更好吗?是的。它比Pika Labs、RunwayML和 StableVideo 更好吗?它好太多了。
再推出一两个版本,Kling 就可能颠覆整个视频内容行业。
