概述:
《中国AI实验室内部笔记——来自与中国领先AI实验室交流的洞见》是 AI2 研究员 Nathan Lambert 在访问中国多家领先 AI 实验室后写下的观察札记。作者先后与中国 AI 生态中的研究者、公司和实验室交流,包括阿里、智谱、月之暗面、清华、美团、小米、零一万物等。他的核心感受是:中国 AI 实验室不是西方想象中的简单“追赶者”,而是在组织文化、人才结构、开源策略和产业逻辑上形成了一套不同于美国的 AI 发展模式。 文章首先讨论“中国研究者的心态”。作者认为,中国大模型公司非常适合做“快速跟随者”:它们擅长把已有技术方向快速工程化、规模化,并在数据、架构、强化学习、模型训练等全栈环节做细致优化。相比美国实验室更强调个人表达、研究者声望和“明星科学家”路径,中国团队似乎更愿意把个人想法让位于最终模型效果,更能承受大量“不显眼但重要”的工程工作。作者认为,这种文化差异可能会在今天的大模型竞争中带来真实优势。
他特别注意到,中国很多核心模型贡献者仍是在读学生,实验室整体很年轻。这些年轻研究者没有被上一代 AI 范式束缚,能够快速吸收从 MoE、RL 到 Agent 的新技术变化,并全身心投入模型改进。与此同时,作者也指出,这种优势可能对应另一个问题:相比“从 0 到 1”的原创性研究,中国实验室目前更擅长在已有方向上快速推进和优化。
第二部分讨论中国 AI 产业与西方的不同。作者认为,中国 AI 行业不能简单套用美国 OpenAI、Anthropic 那套生态模型。中国公司普遍有更强的“技术所有权”意识:美团、蚂蚁、小米等公司之所以做自己的通用大模型,并不只是为了追热点,而是因为它们相信 LLM 会成为未来产品技术栈的核心,因此必须掌握底层能力。美国类似公司往往会直接采购外部 AI 服务,而中国公司更倾向于自己构建。
文章也提到几个产业观察:第一,中国国内 AI 需求已经出现早期信号,AI 支出可能更接近云计算,而不是传统 SaaS;第二,中国开发者非常关注 Claude,尽管 Claude 在中国并不正式可用;第三,中国实验室对英伟达芯片仍然非常渴望,训练端算力不足是普遍约束;第四,中国本土数据产业相对不成熟,很多实验室更倾向于自己构建 RL 环境和数据,而不是从外部购买。
关于政府支持,作者的态度比较谨慎。他认为中国政府确实会在不同层级上支持 AI 公司,例如减少行政阻碍、吸引企业落地等,但这种支持的规模、方式和影响并不清楚。他没有看到最高层政府直接影响模型技术决策的迹象。
文章最后落到“全球 AI 均衡”的问题。作者说,这次中国之行让他意识到,西方决策者很难用既有框架准确理解中国 AI 生态。中国实验室并不是简单的开源理想主义者,它们开放模型更多是出于务实目的:获得开发者反馈、增强生态影响力、提升模型能力,同时保留内部产品化版本。
整体来看,这篇文章的主旨是:中国 AI 生态的竞争力来自一种“工程化、年轻化、协作化、重自主控制”的组合。它可能不完全复制美国前沿实验室的路线,也不只是落后数月的追赶者,而是在不同产业约束和文化条件下形成了自己的 AI 发展路径。
以下为文章原文翻译:
从杭州到上海的高铁上,我望着窗外,夕阳映照下,起伏的山脊上点缀着风力涡轮机,山峦成为广阔田野和密集摩天大楼的背景。我带着极大的谦逊从中国归来。去到一个如此陌生的地方,却受到如此热情的欢迎,这是一种温暖而人性化的体验。我有幸见到了许多之前只在远处知道的AI生态系统中的人士,他们以灿烂的笑容和欢呼迎接我,让我再次感受到我的工作和整个AI生态是多么全球化。
中国研究者的心态
中国公司构建语言模型的方式,完美契合了“快速跟随者”的定位,他们依托教育和工作领域的悠久文化传统,并采用与西方略有不同的技术公司构建方式。从输出结果看——最新的大型模型支持代理工作流,以及背后的优秀科学家、大规模数据和加速计算——中国实验室与美国实验室在表面上非常相似。但持久的差异体现在组织方式和文化 conditioning 上。
我长期认为,中国实验室之所以能如此出色地追赶并跟上前沿,是因为他们在文化上与这项任务高度契合。但在没有直接交流之前,我觉得不该把这种直觉归因于重大影响。与中国领先实验室众多优秀、谦逊且开放的科学家交谈后,我的许多信念得以明确。
如今构建最佳LLM,很大程度上取决于整个栈的细致工作:从数据到架构细节,再到RL算法实现。模型的每个点都能带来改进,而将它们整合在一起是一个复杂过程,需要将一些天才个体的出色工作搁置,以实现整体模型的多目标优化最大化。
美国研究者显然也非常擅长解决单个组件,但美国文化更鼓励“为自己发声”。作为科学家,如果你为自己的工作大声疾呼,就会更成功;现代文化还推动“领先AI科学家”成为新的成名路径。这直接导致冲突。据传Llama组织因这些利益嵌入层级结构的政治压力而崩溃。我还听说其他实验室有时需要“收买”顶级研究者,让他们停止抱怨自己的想法未被纳入最终模型。不管是否完全属实,这个想法很清楚:自负和职业晋升的欲望会阻碍最佳模型的打造。美国与中国在这种文化上的微小差异,就能对最终输出产生有意义的影响。
这部分也与中国构建模型的人员构成有关。所有实验室的现实是,核心贡献者中有很大比例是活跃的学生。实验室都很年轻,这让我想起我们在Ai2的设置:学生被视为同行,直接融入LLM团队。这与美国顶级实验室(如OpenAI、Anthropic、Cursor等)完全不同——它们根本不提供实习机会。谷歌等公司名义上有与Gemini相关的实习,但很多人担心实习会被隔离,无法接触真实工作。 总结这种文化微调如何提升模型构建能力:
- 新进入AI领域的人不受先前AI炒作周期的影响,能更快适应现代技术(事实上,我交谈的一位中国科学家特别强调了这一优势);
- 自负减少,组织架构能略微扩展,因为“玩弄系统”的现象更少;
这种对当今语言模型构建技能的轻微倾斜,与一种常见刻板印象形成对比——中国研究者往往在0到1的开创性学术研究上不够有创意。在我们访问的更学术化的实验室中,许多领导者谈到要培养更具雄心的研究文化。同时,一些技术领导者对这种科学方法的“重构”能否在短期内实现持怀疑态度,因为这需要重新设计教育和激励体系,而这在当前经济均衡下规模太大、难以实现。这种文化正在培养出在LLM构建游戏中表现出色的学生和工程师。当然,他们的数量也极其庞大。
这些学生告诉我,中国和美国一样存在“人才流失”:许多原本考虑学术道路的人现在打算留在行业。最有趣的一句引用来自一位研究者,他原本想当教授以接近教育系统,却说“教育已经被LLM解决了——学生为什么要和我聊天!”
学生们以新鲜的眼光看待LLM,这是他们的优势。过去几年,LLM的关键范式从扩展MoE转向扩展RL,再到启用代理。做好其中任何一项都需要快速吸收海量上下文——包括更广泛的文献和公司内部的技术栈。学生习惯于此,并乐于谦逊地放下所有先入之见。他们一头扎进去,把一生奉献给改进模型的机会。
这些学生也非常直接,不受那些可能分散科学家注意力的哲学闲聊影响。当我问他们对模型的经济或长期社会风险有何感受时,极少有中国研究者持有成熟的观点或想要影响这些。他们的角色就是构建最佳模型。
这种差异很微妙,也容易被否认,但在与一位优雅、才华横溢且能用英语清晰沟通的研究者长时间交谈时,你会最强烈地感受到它:当问到AI更哲学层面的基础问题时,空气中弥漫着单纯的困惑。对他们来说,这是范畴错误。一位研究者甚至引用丹·王(Dan Wang)的著名前提——中国由工程师治理,而美国由律师治理——来强调他们对“构建”的渴望。中国没有像Dwarkesh或Lex那样的主流播客,能系统性地放大中国科学家的明星效应。
当我试图让中国科学家评论AI引发的经济不确定性、超越简单AGI的能力问题,或模型行为的道德辩论时,所有这些都凸显了这些科学家的极度谦逊。他们不仅致力于自己的工作,更不愿对他们不了解的问题发表意见。
放眼望去——尤其是北京,感觉很像湾区:竞争激烈的实验室步行或Uber几分钟就能到达。我下飞机后,在去酒店的路上顺道去了阿里巴巴北京园区。然后在36小时内,我们走访了Z.ai、Moonshot AI、清华大学、美团、小米和01.ai。在中国用滴滴打车很方便,如果你选XL车型,通常会配电动小面包车,还带按摩椅。我们问研究者关于人才战争的情况,他们说这和我们在美国的经历非常相似。研究者跳槽很正常,人们选择去哪里主要看当前的最佳“氛围”。
在中国,LLM社区感觉更像一个生态系统,而不是相互厮杀的部落。在许多非正式谈话中,只有对同行的尊重。所有中国实验室都畏惧字节跳动及其受欢迎的豆包模型——这是中国唯一的前沿闭源实验室。同时,所有实验室都对DeepSeek抱有极大尊重,认为它是执行力上研究品味最好的实验室。在美国,非正式会面时,研究者之间很快就会火药味十足。 中国研究者谦逊的最惊人之处,还体现在他们对商业侧面的态度:他们常常耸耸肩,说“这不是我的问题”,而在美国,每个人似乎都痴迷于各种生态层面的产业趋势——从数据销售商到算力或融资。
中国AI产业与西方实验室的差异(与相似之处)
如今构建AI模型的有趣之处在于,它不再只是把一群优秀研究者聚在一个楼里,创造一个工程奇迹。过去是这样,但要维持AI业务,LLM正成为构建、部署、融资和获取采用的混合体。领先AI公司存在于复杂的生态系统中,这些生态提供资金、算力、数据等,以持续推动前沿。
西方生态中这些输入的整合方式已被很好地概念化和映射(如Anthropic和OpenAI的典型例子),因此发现中国实验室在这方面的思考有重大差异,就能指出不同公司在未来押注上的区别。当然,这些未来可能很大程度上受资金和/或算力限制的影响。
我记录了与这些实验室交流后,在“AI产业”层面最大的 takeaways:
- 国内AI需求出现早期迹象。有一种广为流传的假设:中国AI市场会更小,因为中国公司倾向于不付费购买软件——从而无法解锁支持实验室的巨大推理市场。这只适用于映射到SaaS生态的软件支出,而SaaS在中国历史上很小;另一方面,中国显然仍有庞大的云市场。一个关键未解问题——中国实验室自己也在争论——是企业对AI的支出是否会追踪SaaS市场(小)还是云市场(基础)。总体感觉是AI正更接近云市场,没人 actively 担心新工具周围的市场增长问题。
- 大多数开发者都“Claude上头”。中国大多数AI开发者都痴迷于Claude,以及它如何改变了他们构建软件的方式,尽管Claude名义上在中国被禁。仅仅因为中国历史上不愿购买软件,并不意味着不会出现推理需求的巨大激增。中国技术人员如此务实、谦逊且有动力——这一事实似乎强于任何对过去不花钱习惯的坚持。有些中国研究者提到会用自己的工具(如Kimi或GLM CLI)构建,但所有人都提到用Claude构建。还有令人惊讶地很少提到Codex,而Codex在湾区正迅速流行。
- 中国公司有技术所有权心态。中国文化与强劲的经济引擎结合,正在创造不可预测的结果。我留下一个持久印象:众多AI模型反映了这里众多技术企业的务实当前均衡。没有总体规划。这个行业由对字节跳动和阿里巴巴的尊重定义——作为拥有大量资源的 incumbents,它们被期待在所有市场中赢得大部分份额。DeepSeek是受尊重的技术领导者,但远非市场领导者。他们设定方向,但并未被设定为在经济上获胜。这让像 美团 或 蚂蚁集团 这样的公司(西方人可能会惊讶他们也在构建这些模型)变得合理。实际上,他们认为LLM显然是未来技术产品的核心,因此需要强大的基础。当他们微调强大的通用模型时,这能强化他们的栈,避免依赖开源社区的反馈,同时他们可以为自己的产品保留内部微调版本。该行业的“开放优先”心态主要由务实定义——它帮助他们的模型获得强大反馈,回馈开源社区,并赋能他们的使命。
- 政府援助是真实的,但规模不明。人们常断言中国政府正在积极帮助开放LLM竞赛。这是一个分散在多层级的政府,每个层级都没有明确的 playbook 来决定具体该做什么。北京的各个社区都在竞争吸引科技公司入驻。为这些公司提供的“帮助”几乎肯定包括清除官僚障碍(如许可),但能走多远?各级政府能帮助吸引人才吗?能帮助走私芯片吗?在访问中,有许多提到政府兴趣或帮助,但远不足以让我 assertive 地报告细节,或对政府如何改变中国AI轨迹形成自信的世界观。当然,没有任何迹象表明中国政府高层在影响模型的任何技术决策。
- 数据产业远未发达。听说Anthropic或OpenAI为单个环境花费1000万美元以上,每年累计数百亿美元用于推动RL前沿后,我们迫切想知道中国实验室是否在从美国公司购买相同环境,或由国内镜像生态支持。答案并非完全“没有数据产业”,而是他们的经验是数据产业质量相对较差,通常自己构建环境或数据更划算。研究者自己会花大量时间制作RL训练环境,而字节跳动、阿里巴巴等更大公司则有内部数据标注团队支持。这一切都反映了前一条的“自建而非购买”心态。
- 对更多英伟达芯片的渴望。英伟达算力是训练的金标准,每个人都因缺乏更多芯片而受限。如果有供应,他们显然会购买。其他加速器(包括但不限于华为)在推理方面得到积极评价。无数实验室都能接触到华为芯片。
这些点描绘了一个非常不同的AI生态图景:快速将西方实验室的运作方式映射到中国对应方,往往会导致范畴错误。关键问题是,这些不同生态是否会产生有意义的不同类型模型,还是中国模型总是可以用“类似于3-9个月前的美国前沿模型”来解释。
结论:全球均衡
我去中国前就知道自己对中国了解甚少,回来后感觉才刚刚开始学习。中国不是一个能用规则或配方表达的地方,而是一个拥有非常不同动态和化学反应的地方。这种文化如此古老、如此深厚,且仍与国内技术构建方式完全交织在一起。我还有更多要学习。
美国当前的权力结构中,很多都把他们对中国的现有世界观作为关键决策心理工具。在亲自(正式或非正式)与中国几乎所有领先AI实验室交谈后,我发现中国有很多特质和本能,用西方决策方式很难建模。即使直接询问为什么这些实验室要开放发布顶级模型,技术所有权心态与真正生态支持之间的交集,我也很难把点连起来。
这里的实验室务实,并非在开源上绝对主义(并非每个模型都必须开放),但他们在支持开发者、生态系统,并将其作为更多了解自己模型的方式上,有着深刻的意图。
几乎每家主要中国科技公司都在构建自己的通用LLM,就像我们看到的美团(配送服务)和小米(广泛消费科技公司)发布开源权重模型一样。美国同类公司只会购买服务。这些公司构建LLM并非为了追逐热门新事物,而是出于一种深刻的根本渴望:控制自己的技术栈,并开发当今最重要的技术。当我从笔记本电脑上抬起头,总能看到地平线上成群的起重机,这显然与中国更广泛的“构建”文化和能量相符。
中国研究者的人性、魅力和真挚温暖极具人性化。从个人层面,我们在美国习惯的地缘政治切割式对话,完全没有渗透到他们身上。世界需要更多这种简单的积极性。作为AI社区的一员,我目前更担心的是围绕国籍标签在成员和群体中出现的裂痕。
如果我说我不想让美国实验室在AI栈的每个部分都成为明确领导者——尤其是在我投入时间的开源模型领域——那我就是在撒谎。我是美国人,这是诚实的偏好。与此同时,我希望开源生态本身能在全球蓬勃发展,因为这能为世界创造更安全、更易获取、更实用的AI,而现在的问题是美国实验室是否会采取步骤来掌握这一领导地位。
在完成这篇文章时,更多传闻正在流传,说行政命令会影响开源模型,这可能进一步复杂化美国领导力与全球生态之间的协同——这并未让我充满信心。 感谢我在Moonshot、智谱、美团、小米、Qwen、蚂蚁灵、01.ai以及其他地方交谈过的所有优秀人士。每个人都如此热情好客,并慷慨地付出时间。我会继续分享我对中国(无论是整体文化还是AI具体方面)的思考逐渐成形后的想法。显然,这些知识将直接与AI开发前沿正在展开的故事相关。