Nathan Lambert ：来自中国 AI 实验室内部的笔记

2026-05-08 11:50

193

概述：

《中国AI实验室内部笔记——来自与中国领先AI实验室交流的洞见》是 AI2 研究员 Nathan Lambert 在访问中国多家领先 AI 实验室后写下的观察札记。作者先后与中国 AI 生态中的研究者、公司和实验室交流，包括阿里、智谱、月之暗面、清华、美团、小米、零一万物等。他的核心感受是：中国 AI 实验室不是西方想象中的简单“追赶者”，而是在组织文化、人才结构、开源策略和产业逻辑上形成了一套不同于美国的 AI 发展模式。

文章首先讨论“中国研究者的心态”。作者认为，中国大模型公司非常适合做“快速跟随者”：它们擅长把已有技术方向快速工程化、规模化，并在数据、架构、强化学习、模型训练等全栈环节做细致优化。相比美国实验室更强调个人表达、研究者声望和“明星科学家”路径，中国团队似乎更愿意把个人想法让位于最终模型效果，更能承受大量“不显眼但重要”的工程工作。作者认为，这种文化差异可能会在今天的大模型竞争中带来真实优势。

他特别注意到，中国很多核心模型贡献者仍是在读学生，实验室整体很年轻。这些年轻研究者没有被上一代 AI 范式束缚，能够快速吸收从 MoE、RL 到 Agent 的新技术变化，并全身心投入模型改进。与此同时，作者也指出，这种优势可能对应另一个问题：相比“从 0 到 1”的原创性研究，中国实验室目前更擅长在已有方向上快速推进和优化。

第二部分讨论中国 AI 产业与西方的不同。作者认为，中国 AI 行业不能简单套用美国 OpenAI、Anthropic 那套生态模型。中国公司普遍有更强的“技术所有权”意识：美团、蚂蚁、小米等公司之所以做自己的通用大模型，并不只是为了追热点，而是因为它们相信 LLM 会成为未来产品技术栈的核心，因此必须掌握底层能力。美国类似公司往往会直接采购外部 AI 服务，而中国公司更倾向于自己构建。

文章也提到几个产业观察：第一，中国国内 AI 需求已经出现早期信号，AI 支出可能更接近云计算，而不是传统 SaaS；第二，中国开发者非常关注 Claude，尽管 Claude 在中国并不正式可用；第三，中国实验室对英伟达芯片仍然非常渴望，训练端算力不足是普遍约束；第四，中国本土数据产业相对不成熟，很多实验室更倾向于自己构建 RL 环境和数据，而不是从外部购买。

关于政府支持，作者的态度比较谨慎。他认为中国政府确实会在不同层级上支持 AI 公司，例如减少行政阻碍、吸引企业落地等，但这种支持的规模、方式和影响并不清楚。他没有看到最高层政府直接影响模型技术决策的迹象。

文章最后落到“全球 AI 均衡”的问题。作者说，这次中国之行让他意识到，西方决策者很难用既有框架准确理解中国 AI 生态。中国实验室并不是简单的开源理想主义者，它们开放模型更多是出于务实目的：获得开发者反馈、增强生态影响力、提升模型能力，同时保留内部产品化版本。

整体来看，这篇文章的主旨是：中国 AI 生态的竞争力来自一种“工程化、年轻化、协作化、重自主控制”的组合。它可能不完全复制美国前沿实验室的路线，也不只是落后数月的追赶者，而是在不同产业约束和文化条件下形成了自己的 AI 发展路径。

以下为文章原文翻译：

从杭州到上海的高铁上，我望着窗外，夕阳映照下，起伏的山脊上点缀着风力涡轮机，山峦成为广阔田野和密集摩天大楼的背景。我带着极大的谦逊从中国归来。去到一个如此陌生的地方，却受到如此热情的欢迎，这是一种温暖而人性化的体验。我有幸见到了许多之前只在远处知道的AI生态系统中的人士，他们以灿烂的笑容和欢呼迎接我，让我再次感受到我的工作和整个AI生态是多么全球化。

中国研究者的心态

中国公司构建语言模型的方式，完美契合了“快速跟随者”的定位，他们依托教育和工作领域的悠久文化传统，并采用与西方略有不同的技术公司构建方式。从输出结果看——最新的大型模型支持代理工作流，以及背后的优秀科学家、大规模数据和加速计算——中国实验室与美国实验室在表面上非常相似。但持久的差异体现在组织方式和文化 conditioning 上。

我长期认为，中国实验室之所以能如此出色地追赶并跟上前沿，是因为他们在文化上与这项任务高度契合。但在没有直接交流之前，我觉得不该把这种直觉归因于重大影响。与中国领先实验室众多优秀、谦逊且开放的科学家交谈后，我的许多信念得以明确。

如今构建最佳LLM，很大程度上取决于整个栈的细致工作：从数据到架构细节，再到RL算法实现。模型的每个点都能带来改进，而将它们整合在一起是一个复杂过程，需要将一些天才个体的出色工作搁置，以实现整体模型的多目标优化最大化。

美国研究者显然也非常擅长解决单个组件，但美国文化更鼓励“为自己发声”。作为科学家，如果你为自己的工作大声疾呼，就会更成功；现代文化还推动“领先AI科学家”成为新的成名路径。这直接导致冲突。据传Llama组织因这些利益嵌入层级结构的政治压力而崩溃。我还听说其他实验室有时需要“收买”顶级研究者，让他们停止抱怨自己的想法未被纳入最终模型。不管是否完全属实，这个想法很清楚：自负和职业晋升的欲望会阻碍最佳模型的打造。美国与中国在这种文化上的微小差异，就能对最终输出产生有意义的影响。

这部分也与中国构建模型的人员构成有关。所有实验室的现实是，核心贡献者中有很大比例是活跃的学生。实验室都很年轻，这让我想起我们在Ai2的设置：学生被视为同行，直接融入LLM团队。这与美国顶级实验室（如OpenAI、Anthropic、Cursor等）完全不同——它们根本不提供实习机会。谷歌等公司名义上有与Gemini相关的实习，但很多人担心实习会被隔离，无法接触真实工作。

总结这种文化微调如何提升模型构建能力：

更愿意做不那么闪耀的工作，以改善最终模型；

新进入AI领域的人不受先前AI炒作周期的影响，能更快适应现代技术（事实上，我交谈的一位中国科学家特别强调了这一优势）；

自负减少，组织架构能略微扩展，因为“玩弄系统”的现象更少；

丰富的人才非常适合解决已有证明概念的问题，等等。

这种对当今语言模型构建技能的轻微倾斜，与一种常见刻板印象形成对比——中国研究者往往在0到1的开创性学术研究上不够有创意。在我们访问的更学术化的实验室中，许多领导者谈到要培养更具雄心的研究文化。同时，一些技术领导者对这种科学方法的“重构”能否在短期内实现持怀疑态度，因为这需要重新设计教育和激励体系，而这在当前经济均衡下规模太大、难以实现。这种文化正在培养出在LLM构建游戏中表现出色的学生和工程师。当然，他们的数量也极其庞大。

这些学生告诉我，中国和美国一样存在“人才流失”：许多原本考虑学术道路的人现在打算留在行业。最有趣的一句引用来自一位研究者，他原本想当教授以接近教育系统，却说“教育已经被LLM解决了——学生为什么要和我聊天！”

学生们以新鲜的眼光看待LLM，这是他们的优势。过去几年，LLM的关键范式从扩展MoE转向扩展RL，再到启用代理。做好其中任何一项都需要快速吸收海量上下文——包括更广泛的文献和公司内部的技术栈。学生习惯于此，并乐于谦逊地放下所有先入之见。他们一头扎进去，把一生奉献给改进模型的机会。

这些学生也非常直接，不受那些可能分散科学家注意力的哲学闲聊影响。当我问他们对模型的经济或长期社会风险有何感受时，极少有中国研究者持有成熟的观点或想要影响这些。他们的角色就是构建最佳模型。

这种差异很微妙，也容易被否认，但在与一位优雅、才华横溢且能用英语清晰沟通的研究者长时间交谈时，你会最强烈地感受到它：当问到AI更哲学层面的基础问题时，空气中弥漫着单纯的困惑。对他们来说，这是范畴错误。一位研究者甚至引用丹·王（Dan Wang）的著名前提——中国由工程师治理，而美国由律师治理——来强调他们对“构建”的渴望。中国没有像Dwarkesh或Lex那样的主流播客，能系统性地放大中国科学家的明星效应。

当我试图让中国科学家评论AI引发的经济不确定性、超越简单AGI的能力问题，或模型行为的道德辩论时，所有这些都凸显了这些科学家的极度谦逊。他们不仅致力于自己的工作，更不愿对他们不了解的问题发表意见。

放眼望去——尤其是北京，感觉很像湾区：竞争激烈的实验室步行或Uber几分钟就能到达。我下飞机后，在去酒店的路上顺道去了阿里巴巴北京园区。然后在36小时内，我们走访了Z.ai、Moonshot AI、清华大学、美团、小米和01.ai。在中国用滴滴打车很方便，如果你选XL车型，通常会配电动小面包车，还带按摩椅。我们问研究者关于人才战争的情况，他们说这和我们在美国的经历非常相似。研究者跳槽很正常，人们选择去哪里主要看当前的最佳“氛围”。

在中国，LLM社区感觉更像一个生态系统，而不是相互厮杀的部落。在许多非正式谈话中，只有对同行的尊重。所有中国实验室都畏惧字节跳动及其受欢迎的豆包模型——这是中国唯一的前沿闭源实验室。同时，所有实验室都对DeepSeek抱有极大尊重，认为它是执行力上研究品味最好的实验室。在美国，非正式会面时，研究者之间很快就会火药味十足。

中国研究者谦逊的最惊人之处，还体现在他们对商业侧面的态度：他们常常耸耸肩，说“这不是我的问题”，而在美国，每个人似乎都痴迷于各种生态层面的产业趋势——从数据销售商到算力或融资。

中国AI产业与西方实验室的差异（与相似之处）

如今构建AI模型的有趣之处在于，它不再只是把一群优秀研究者聚在一个楼里，创造一个工程奇迹。过去是这样，但要维持AI业务，LLM正成为构建、部署、融资和获取采用的混合体。领先AI公司存在于复杂的生态系统中，这些生态提供资金、算力、数据等，以持续推动前沿。

西方生态中这些输入的整合方式已被很好地概念化和映射（如Anthropic和OpenAI的典型例子），因此发现中国实验室在这方面的思考有重大差异，就能指出不同公司在未来押注上的区别。当然，这些未来可能很大程度上受资金和/或算力限制的影响。

我记录了与这些实验室交流后，在“AI产业”层面最大的 takeaways：

国内AI需求出现早期迹象。有一种广为流传的假设：中国AI市场会更小，因为中国公司倾向于不付费购买软件——从而无法解锁支持实验室的巨大推理市场。这只适用于映射到SaaS生态的软件支出，而SaaS在中国历史上很小；另一方面，中国显然仍有庞大的云市场。一个关键未解问题——中国实验室自己也在争论——是企业对AI的支出是否会追踪SaaS市场（小）还是云市场（基础）。总体感觉是AI正更接近云市场，没人 actively 担心新工具周围的市场增长问题。

大多数开发者都“Claude上头”。中国大多数AI开发者都痴迷于Claude，以及它如何改变了他们构建软件的方式，尽管Claude名义上在中国被禁。仅仅因为中国历史上不愿购买软件，并不意味着不会出现推理需求的巨大激增。中国技术人员如此务实、谦逊且有动力——这一事实似乎强于任何对过去不花钱习惯的坚持。有些中国研究者提到会用自己的工具（如Kimi或GLM CLI）构建，但所有人都提到用Claude构建。还有令人惊讶地很少提到Codex，而Codex在湾区正迅速流行。

中国公司有技术所有权心态。中国文化与强劲的经济引擎结合，正在创造不可预测的结果。我留下一个持久印象：众多AI模型反映了这里众多技术企业的务实当前均衡。没有总体规划。这个行业由对字节跳动和阿里巴巴的尊重定义——作为拥有大量资源的 incumbents，它们被期待在所有市场中赢得大部分份额。DeepSeek是受尊重的技术领导者，但远非市场领导者。他们设定方向，但并未被设定为在经济上获胜。这让像美团或蚂蚁集团这样的公司（西方人可能会惊讶他们也在构建这些模型）变得合理。实际上，他们认为LLM显然是未来技术产品的核心，因此需要强大的基础。当他们微调强大的通用模型时，这能强化他们的栈，避免依赖开源社区的反馈，同时他们可以为自己的产品保留内部微调版本。该行业的“开放优先”心态主要由务实定义——它帮助他们的模型获得强大反馈，回馈开源社区，并赋能他们的使命。

政府援助是真实的，但规模不明。人们常断言中国政府正在积极帮助开放LLM竞赛。这是一个分散在多层级的政府，每个层级都没有明确的 playbook 来决定具体该做什么。北京的各个社区都在竞争吸引科技公司入驻。为这些公司提供的“帮助”几乎肯定包括清除官僚障碍（如许可），但能走多远？各级政府能帮助吸引人才吗？能帮助走私芯片吗？在访问中，有许多提到政府兴趣或帮助，但远不足以让我 assertive 地报告细节，或对政府如何改变中国AI轨迹形成自信的世界观。当然，没有任何迹象表明中国政府高层在影响模型的任何技术决策。

数据产业远未发达。听说Anthropic或OpenAI为单个环境花费1000万美元以上，每年累计数百亿美元用于推动RL前沿后，我们迫切想知道中国实验室是否在从美国公司购买相同环境，或由国内镜像生态支持。答案并非完全“没有数据产业”，而是他们的经验是数据产业质量相对较差，通常自己构建环境或数据更划算。研究者自己会花大量时间制作RL训练环境，而字节跳动、阿里巴巴等更大公司则有内部数据标注团队支持。这一切都反映了前一条的“自建而非购买”心态。

对更多英伟达芯片的渴望。英伟达算力是训练的金标准，每个人都因缺乏更多芯片而受限。如果有供应，他们显然会购买。其他加速器（包括但不限于华为）在推理方面得到积极评价。无数实验室都能接触到华为芯片。

这些点描绘了一个非常不同的AI生态图景：快速将西方实验室的运作方式映射到中国对应方，往往会导致范畴错误。关键问题是，这些不同生态是否会产生有意义的不同类型模型，还是中国模型总是可以用“类似于3-9个月前的美国前沿模型”来解释。

结论：全球均衡

我去中国前就知道自己对中国了解甚少，回来后感觉才刚刚开始学习。中国不是一个能用规则或配方表达的地方，而是一个拥有非常不同动态和化学反应的地方。这种文化如此古老、如此深厚，且仍与国内技术构建方式完全交织在一起。我还有更多要学习。

美国当前的权力结构中，很多都把他们对中国的现有世界观作为关键决策心理工具。在亲自（正式或非正式）与中国几乎所有领先AI实验室交谈后，我发现中国有很多特质和本能，用西方决策方式很难建模。即使直接询问为什么这些实验室要开放发布顶级模型，技术所有权心态与真正生态支持之间的交集，我也很难把点连起来。

这里的实验室务实，并非在开源上绝对主义（并非每个模型都必须开放），但他们在支持开发者、生态系统，并将其作为更多了解自己模型的方式上，有着深刻的意图。

几乎每家主要中国科技公司都在构建自己的通用LLM，就像我们看到的美团（配送服务）和小米（广泛消费科技公司）发布开源权重模型一样。美国同类公司只会购买服务。这些公司构建LLM并非为了追逐热门新事物，而是出于一种深刻的根本渴望：控制自己的技术栈，并开发当今最重要的技术。当我从笔记本电脑上抬起头，总能看到地平线上成群的起重机，这显然与中国更广泛的“构建”文化和能量相符。

中国研究者的人性、魅力和真挚温暖极具人性化。从个人层面，我们在美国习惯的地缘政治切割式对话，完全没有渗透到他们身上。世界需要更多这种简单的积极性。作为AI社区的一员，我目前更担心的是围绕国籍标签在成员和群体中出现的裂痕。

如果我说我不想让美国实验室在AI栈的每个部分都成为明确领导者——尤其是在我投入时间的开源模型领域——那我就是在撒谎。我是美国人，这是诚实的偏好。与此同时，我希望开源生态本身能在全球蓬勃发展，因为这能为世界创造更安全、更易获取、更实用的AI，而现在的问题是美国实验室是否会采取步骤来掌握这一领导地位。

在完成这篇文章时，更多传闻正在流传，说行政命令会影响开源模型，这可能进一步复杂化美国领导力与全球生态之间的协同——这并未让我充满信心。

感谢我在Moonshot、智谱、美团、小米、Qwen、蚂蚁灵、01.ai以及其他地方交谈过的所有优秀人士。每个人都如此热情好客，并慷慨地付出时间。我会继续分享我对中国（无论是整体文化还是AI具体方面）的思考逐渐成形后的想法。显然，这些知识将直接与AI开发前沿正在展开的故事相关。

好文章，需要你的鼓励