金融时报:DeepSeek V4 下周发布,并将具备图像和视频生成功能

2026-02-28 13:37
49
据英国《金融时报》报道,中国 AI 实验室 DeepSeek 计划于下周正式发布其新一代旗舰模型 V4。与前代不同,V4 将是 DeepSeek 首款多模态模型,可同时处理文本、图像等多种数据类型。更引人关注的是,DeepSeek 已与华为和中国 AI 芯片制造商寒武纪达成合作,为两家公司的国产芯片产品专门优化 V4 模型。

这一合作标志着 DeepSeek 在"去美化"算力路径上迈出关键一步。此前,DeepSeek 主要依赖 NVIDIA 低规格出口芯片完成模型训练,而与华为昇腾和寒武纪思元系列芯片的深度适配,意味着中国 AI 产业正加速构建独立于美国芯片的完整技术栈。
技术层面,DeepSeek 近日已向其核心计算库 DeepGEMM 推送重大更新,正式集成 mHC(Manifold-Constrained Hyperconnections)算法,同时新增 NVIDIA Blackwell 架构支持和 FP4 超低精度计算能力——这表明 V4 在适配国产芯片的同时,也保持了对国际主流硬件的兼容性。
据此前多方报道,V4 内部基准测试在长代码生成任务上已超越 Anthropic Claude 和 OpenAI GPT 同代模型,上下文窗口扩展至 100 万 token,并集成了 Engram 条件记忆架构,大幅提升复杂任务处理能力。多模态能力的加入,则使 V4 从专注文本和代码的模型升级为全场景通用型 AI 系统。
华尔街正密切关注这一动态。一年前 DeepSeek R1 发布曾导致纳斯达克单日暴跌 3%,NVIDIA 市值蒸发近 6000 亿美元。而此次 V4 不仅性能更强,还首次展示了与国产芯片生态的深度绑定,这对美国芯片出口管制政策的有效性提出了更直接的挑战。2026 年美国科技巨头 AI 资本支出预计达 6500 亿美元,DeepSeek 持续以极低成本实现前沿性能的能力,正在根本性地动摇"烧钱即壁垒"的行业逻辑。
野村证券分析指出,V4 的核心价值在于通过基础架构创新推动 AI 应用商业化落地。mHC 和 Engram 技术从算法层面突破算力瓶颈,与国产芯片优化的结合将进一步压低训练和推理成本,有望催生新一轮 AI 基础设施建设需求。
DeepSeek 预计将延续开源策略发布 V4,开发者可在消费级硬件上本地部署。随着多模态能力、国产芯片适配和前沿架构创新三线汇聚,DeepSeek V4 的发布不仅是一次产品迭代,更可能重塑全球 AI 竞争格局。

0
好文章,需要你的鼓励