巴西市政机构发布的"前沿模型"被证实为开源模型换皮，72小时从爆红到打脸

2026-06-15 10:16

6月15日消息，本周在Hugging Face上爆火的Rio 3.5 Open 397B模型，被证实并非其开发者声称的原创前沿模型，而是将Nex N2 Pro和Qwen 3.5两个开源模型按约6:4比例线性合并的产物。Rio方面已更新模型卡承认事实并公开致歉。

一个市政机构做出SOTA模型的故事

Rio 3.5由IplanRIO发布——这是巴西里约热内卢市政府旗下的IT公司，负责该市的数字基础设施和公共服务。模型卡自称其为"前沿级通用AI模型"，基于Qwen 3.5-397B后训练，在编程、数学、STEM、多语言和多模态基准上全面超越其基座模型，可与全球最强的开源和闭源模型竞争。

一个城市政府的IT部门做出SOTA级大模型——这个叙事本身就自带传播力。模型迅速登上Hugging Face热榜，Hugging Face CEO Clem Delangue亲自发文点赞，称其为开源AI民主化的范例，并将其上升到"AI未来的两条路径"之争：封闭API由硅谷和华盛顿的少数人决定，还是开源AI让每个人（包括里约市政府这样的机构）都能参与、拥有和共建。

社区反响热烈。多个量化版本迅速发布，推理部署指南、GGUF转换版在几小时内出现，有用户在Hugging Face申请推理提供商支持。这是本周继Nex N2 Pro之后，第二个基于Qwen 3.5后训练并达到SOTA水平的开源模型。

两项铁证揭露真相

Nex团队在GitHub Issue中发布了完整的分析报告，提供了两条独立的证据链。

第一项证据是身份测试。去掉Rio 3.5硬编码的"You are Rio"系统提示词后，模型在79%的情况下自我介绍为"Nex, from Nex-AGI"，0%的情况自称Rio，甚至能逐字复述Nex组织的专属背景故事。这相当于一幅赝品在签名处写了原作者的名字。

第二项证据是权重分析。Nex团队对Rio 3.5全部60层、每个网络组件的权重张量进行了逐元素比对，发现每个张量都精确匹配0.6 × Nex N2 Pro + 0.4 × Qwen 3.5的线性混合比例，偏差在数千个标准差范围内可忽略。这种数学精度排除了任何独立训练的可能性——其他微调模型不可能被解释为两个已知模型的简单线性插值。

Nex团队同时发布了验证脚本，任何人都可以自行复现分析。

Rio方面的回应

面对证据，Rio方面更新了模型卡，承认Rio 3.5是基于Nex N2 Pro和Qwen 3.5-397B的合并版本，并声称在合并基础上进行了"在策略蒸馏"（On-Policy Distillation），且之前上传的是合并基础版而非最终蒸馏版本，对此表示"深感抱歉"。

但这个解释并未平息争议。Nex团队的分析直接指向"没有发现任何独立训练的证据"，而Rio方面也没有公布蒸馏过程的任何技术细节、训练日志或资源消耗数据。

竞品语境：Nex N2 Pro本身的定位

理解这个事件需要了解Nex N2 Pro自身的背景。Nex N2 Pro是上海创新学院发起的Nex-AGI开源联盟的产品，同样基于Qwen 3.5-397B后训练，并非从零训练的基座模型。其核心贡献是Agent后训练——自适应思考机制（Adaptive Thinking）可根据任务复杂度自动调整推理深度，声称减少30-50%的思考Token消耗。

在自报基准中，Nex N2 Pro在SWE-Bench Verified上达到80.8%，SWE-Bench Pro达到58.8%，与GPT-5.5和Claude Opus 4.7处于同一梯队。但所有数据均为自评，且对比基线是Opus 4.7而非更新的4.8。

Rio 3.5通过合并Nex N2 Pro的权重获得了后者的能力，又通过基座Qwen 3.5的混入获得了一定的泛化性——这恰恰反向验证了Nex N2 Pro后训练的有效性。正如Nex团队在回应中不无幽默地说的："感谢里约市用我们的模型做了终极基准验证。"

事件揭示的开源生态问题

社区讨论中最具洞察力的评论指出：这件事恰恰证明了开源权重的价值。正因为权重完全公开，Nex团队才能在数学层面进行取证分析——逐张量比对、计算混合比例、发布可复现的验证脚本。如果Rio 3.5是一个闭源API，这种取证根本不可能。

但事件也暴露了开源模型生态的归属问题。当后训练的成本远低于预训练，当模型合并工具日益成熟，"换皮"的技术门槛几乎为零。MIT许可证允许任何人出于任何目的使用、修改和重新发布模型权重——合并两个MIT许可的模型并以新名字发布，在法律上可能完全合规。问题不在合法性，而在归属伦理：一个简单的线性合并是否构成"开发"？模型卡中的能力声明是否构成对社区的误导？

Hugging Face目前没有强制性的模型溯源或合并声明机制。这个事件可能推动平台在模型上传流程中增加更严格的来源标注要求。但在那之前，开源社区对模型真实性的验证，只能依赖像Nex团队这样的主动取证。



好文章，需要你的鼓励