国内ai模型网站盘点

今年夏天,中国人工智能生态系统以不懈的步伐发布了一系列开放模型,在人工智能世界掀起了风暴。最受西方媒体关注的旗舰产品是Qwen 3,Kimi K2,或者智普GLM 4.5但是在发布的质量和节奏上,有一个长尾供应商紧随其后。
在这篇文章中,我们根据对开放人工智能生态系统的贡献的质量和数量—这不是原始能力的列表,而是输出——从DeepSeek的顶端一直到新兴的开放研究实验室。要更详细地了解所有具体型号,我们建议研究我们的工件日志系列,它记录了每个月所有主要的开放模型版本。我们计划重新审视这个排名,并记录下主要的新玩家。
DeepSeek几乎不需要介绍。他们的V3和R1模型及其影响仍可能是2025年最大的人工智能故事——开放的、处于性能前沿的中国模型,拥有许可的许可证,以及令全球用户着迷的暴露的模型思想链。
随着突破性的发布引起了所有的关注,关于DeepSeek在操作方面有了更多的说法,意识形态,以及商业模式相对于其他实验室。他们在技术上非常创新,并且没有在他们的消费者聊天机器人或API托管上投入大量资源(根据高于行业标准的性能下降来判断)。
在过去的18个月里,DeepSeek以“每月发布一个主要版本”而闻名。自从V3-0324和R1-0528的更新发布以来,许多密切的观察者对它们缺乏贡献感到惊讶。这让生态系统中的其他玩家缩小了差距,但就影响和实际商业使用而言,DeepSeek仍然是王者。
DeepSeek战略的一个重要方面是他们专注于在性能前沿改进核心模型。为了补充这一点,他们进行实验,利用他们这一代人进行基础研究创新,例如定理证明或数学模型,最终用于模型的下一次迭代。这类似于西方实验室的运作方式。首先,你在内部测试一个新想法作为实验,然后你把它折叠成你的大多数用户看到的“主要产品”。
DeepSeekMath例如,使用了DeepSeek-Coder-Base-v1.5 7B并引入了现在著名的强化学习算法组相关策略优化(GRPO),这是R1的主要驱动力之一。这种情况的例外(至少在今天)是雅努斯,他们的全模态系列,他们主线没用过。
Qwen3是阿里云部门的主要人工智能实验室,迄今为止最出名的是他们的开放语言模型系列。多年来,他们一直在发布各种尺寸的车型(与美洲驼1至3非常相似)。最近他们从Qwen 2.5和Qwen 3的机型都有了加速人工智能研究和创业开发的市场份额.
就发布内容而言,Qwen更接近美国大型科技公司,而不是其他中国人工智能实验室:他们覆盖了整个堆栈,从VLMs到嵌入模型,编码模型,图像和视频生成,等等。
他们还通过发布各种规模的有能力的模型来迎合所有可能的客户(或者说开放社区的每一部分)。小型密集模型对于学术界进行实验和中小型企业推动其应用非常重要,因此基于Qwen的模型越来越受欢迎也就不足为奇了。
除了面向所有人的模型发布,他们还专注于支持(西方)社区,发布MLX和GGUF供本地使用的模型版本或硬币指示器(coin-levelindicator的缩写)命令行界面(Command Line Interface for batch scripting)为他们的编码模型,其中包括大量的免费请求。
与一些美国公司不同,核心团队的人数似乎相对较少,与其他中国人工智能实验室一致:Qwen3有177个贡献者,而Llama 3有三倍的数量,而Gemini 2.5有超过3000人作为模型的一部分。
Kimi是所谓的“AI老虎”之一,是由中国媒体和投资者确定的一群炙手可热的中国AI创业公司。这个群体由百川、智普AI、Moonshot AI、MiniMax、StepFun、01组成。人工智能——其中大多数都吸引了科技基金和其他科技拨款的投资。例如,阿里巴巴被视为人工智能领域的大赢家,因为它拥有自己的模型,并且成为Moonshot的主要投资者,有点像美国的大型科技公司正在为新的人工智能实验室进行融资。
而他们的第一个模型,K1和K1.5,是封闭的,可用的在他们的API上在R1发布之后,他们开始发布开放模型实验模型使用μ子优化器。与DeepSeek类似,他们专注于单个模型行,小实验最终反馈到主模型中。K2是他们的“登月计划”,又名yolo run,并迅速成为一个类似于R1(见我们的报告从发布)。
进一步地阅读关于Kimi的内容可以在ChinaTalk上找到。
智普,在西方被称为Z.ai,是清华大学的一个创业公司可观的投资被中国公司和风投。目前,它们是甚至考虑IPO这将使它们成为第一只这样做的人工智能老虎。
就模型而言,它们最出名的是最近发布的GLM-4.5和GLM-4.5V,就其规模而言,它们都非常有能力(这两者都是专家模型的相当大的混合)。然而,他们不只是发布LLM,还图像和视频生成模型,将它们与纯LLM公司和实验室区分开来。