6月17日消息,阿里巴巴 ATH(Alibaba Token Hub)事业群旗下开放式世界模型产品 HappyOyster 于近日正式发布 1.0 版本,在 happyoyster.com 网页端及移动端全量上线,并推出限时积分活动(即日起至 7 月 17 日每天可领取免费积分)。此前该产品于 4 月 16 日以早期体验形式发布,仅通过邀请码开放有限测试。
1.0 版本的核心变化是产品形态从"交互式视频生成工具"向"可玩的世界模型"明确转型。新增的冒险模式(Adventure Mode)引入了 WASD 键盘控制、跳跃、躲避和敌人战斗等传统游戏交互逻辑,用户可以在 AI 实时生成的场景中自由移动和操作——这已经不是在"看"AI 生成内容,而是在"玩"它。导演模式(Director Mode)同步升级,加入虚拟伙伴实时对话、剧情回溯重写、虚拟宠物、换装和隐藏交互等功能。
世界模型是什么,为什么重要
"世界模型"(World Model)是 2026 年 AI 行业的高频关键词之一。据搜狐报道,智源研究院在《2026 十大 AI 技术趋势》中指出,行业共识正从语言模型转向能理解物理规律的多模态世界模型——从"预测下一个词"转向"预测世界下一状态"(Next-State Prediction)。
区分世界模型和传统视频生成模型的关键在于"交互性"和"连续性"。Sora、Kling、Seedance 等视频生成工具的工作流是线性的:写 Prompt → 等渲染 → 收到成片。世界模型则在生成过程中持续接收用户指令,场景实时响应和演化。这更接近游戏引擎的逻辑,区别在于场景完全由 AI 实时生成而非预先建模。
据腾讯新闻报道,当前世界模型赛道的技术路线主要分为"像素生成派"(以视频生成技术模拟世界,代表包括 Google Genie 3、HappyOyster、Runway GWM-1)和"3D 重建派"(以显式 3D 表征构建持久世界,代表包括 World Labs Marble、NVIDIA Cosmos)。HappyOyster 属于前者,其底层是一个流式生成世界模型,基于原生多模态架构,支持文本、语音、图像输入和音视频联合生成。
1.0 版本做了什么
相比 4 月的早期体验版,1.0 在两个模式上都有实质性扩展。
冒险模式是 1.0 的主要新增。用户可以在深海遗迹、油画世界、超现实梦境等 AI 生成的场景中通过 WASD 控制自由移动,支持滑行、跑酷和翼装飞行等运动方式,并能与场景中的敌人进行战斗。这在世界模型产品中是一个少见的设计取向——大多数同类产品(Google Project Genie、Runway GWM-Worlds)侧重于场景探索和导航,HappyOyster 1.0 则明确向游戏化方向延伸,试图让世界模型不仅"可交互",而且"可玩"。
导演模式在原有基础上强化了叙事交互层。用户可以与虚拟伙伴实时对话,且对话内容会影响后续剧情走向;支持随时暂停和回溯,在任意节点生成新的剧情分支。新增的虚拟宠物、换装和神秘宝箱等玩法,进一步把导演模式从"视频制作工具"推向"互动叙事体验"。
早期体验版中,导演模式支持最长 3 分钟连续 720p 视频生成,漫游模式支持 1 分钟 480p 实时探索。1.0 版本是否提升了时长和分辨率上限,官方暂未明确披露。
竞品格局:一个刚起步的赛道
世界模型赛道在 2026 年上半年迎来密集发布。
Google DeepMind 的 Genie 3 是最直接的对标产品,支持文本生成可交互环境,24fps 实时渲染,已通过 Project Genie 向美国 Google AI Ultra 用户开放测试。其优势在于 Google 的算力规模和 Veo 系列视频模型的技术积累,但目前仅面向美国用户且功能有限。
腾讯混元世界(HY-World 2.0)与 HappyOyster 同期发布(4 月 16 日前后),已开源,下载量据报道超过 300 万次。腾讯的差异化在于游戏和 AR/VR 业务的真实场景牵引。
Runway 在 2025 年底发布 GWM-1,随后拆分为 GWM-Worlds(环境模拟)、GWM-Robotics(机器人训练)、GWM-Avatars(数字人)三条线。据 SimonAKing 分析,Runway 是"一边有视频生成 SaaS 收入,一边转型做世界模型"的路径,商业化基础最扎实。
李飞飞的 World Labs(Marble 产品,10 亿美元融资,54 亿美元估值)和 Yann LeCun 离开 Meta 后创办的 AMI Labs(10.3 亿美元种子轮,35 亿美元估值)代表了学术界转化路线。国内还有昆仑万维 Matrix-Game 3.0(5B 参数,720P,40fps)在游戏场景探索。
整体来看,这个赛道处于"产品形态尚未收敛"的早期阶段——各家对"世界模型应该长什么样"的理解差异很大:有的偏影视预演,有的偏游戏原型,有的偏机器人训练数据生成。HappyOyster 1.0 把赌注压在"游戏化消费体验"上,在同类产品中定位较为独特。
背景:阿里 ATH 和"Happy 宇宙"
HappyOyster 出自阿里巴巴 ATH 事业群的 AI 创新事业部,同一团队此前推出的视频生成模型 HappyHorse(快乐马)曾以 1299 分 Elo 评分登顶 LM Arena 视频编辑排行榜和 Artificial Analysis 图生视频排行榜。据腾讯新闻报道,ATH 事业群由阿里巴巴 CEO 吴泳铭于 2026 年 3 月 16 日亲自挂帅成立,下设通义实验室、MaaS 业务线、千问事业部、悟空事业部及 AI 创新事业部,覆盖从基础模型研发到应用的完整链条。HappyHorse 采用 150 亿参数、40 层单流 Transformer 架构。 从 HappyHorse(视频生成)到 HappyOyster(世界模型),阿里 ATH 的产品逻辑是从"生成一段视频"演进到"生成一个可交互的世界"。这条路线与 Google(Veo → Genie 3)、Runway(Gen 系列 → GWM-1)的演进方向一致:视频生成能力是世界模型的技术前置条件。
英伟达机器人主管 Jim Fan 此前公开表示,2026 年将是大世界模型真正为机器人及多模态 AI 奠定基础的第一年。从资本数据看,World Labs 和 AMI Labs 在三周内合计融资超过 20 亿美元,显示出市场对这一方向的高度押注。
当前局限
世界模型赛道整体处于技术验证期,HappyOyster 也不例外:
画质和时长限制。 早期体验版的漫游模式为 480p/1 分钟,导演模式为 720p/3 分钟。即使 1.0 有所提升,与传统游戏引擎的实时渲染质量仍有代差。在冒险模式中进行 WASD 操控和战斗时,画面连贯性和物理响应精度很可能低于预渲染内容。
物理一致性衰减。 这是所有像素生成派世界模型的共性问题。据多家评测报道,物体在较长时间跨度内仍会出现消失、穿模或违反物理规律的现象。HappyOyster 在冒险模式中增加了物理交互(碰撞、战斗),对物理一致性的要求更高,实际体验是否稳定有待验证。
商业化模式不明。 据 36 氪报道,HappyOyster 在产品层面更偏技术探索,商业化路径尚未清晰。1.0 版本通过限时免费积分吸引用户,但长期定价策略、API 开放计划、开发者生态建设等均未公布。
"可玩性"的天花板。 冒险模式让世界模型"像游戏",但它本质上不是游戏——没有成熟的关卡设计、数值体系和长期内容循环。当新鲜感消退后,用户留存取决于 AI 生成内容的多样性和交互深度能否持续满足预期,这在当前技术条件下是一个开放性问题。
怎么看
HappyOyster 1.0 的意义不在于它的画质或时长参数,而在于它给"世界模型应该是什么"这个问题提供了一个具体答案:不是更好的视频生成工具,也不是专业影视预演系统,而是一个让普通用户可以"走进去玩"的 AI 生成世界。这个定位在同类产品中最接近消费者市场,也最容易被验证——用户是否愿意花时间在一个 AI 实时生成的世界里探索和互动,很快就会有数据。
对于关注世界模型方向的开发者和创作者,HappyOyster 1.0 值得作为体验案例去试用(目前有限时免费积分),但不宜作为生产工具依赖——技术成熟度、画质上限和平台稳定性还需要多个版本的迭代。真正的竞争格局要到 2026 年下半年,Google Genie 3 扩大开放、Runway GWM 系列落地、腾讯 HY-World 进入应用层之后,才能看清。