阿里巴巴的人工智能编码工具在西方引发安全担忧

阿里巴巴发布了一个新的人工智能编码模型,名为Qwen3-Coder,旨在使用一个大型开源模型处理复杂的软件任务。该工具是阿里巴巴Qwen3家族的一部分,被宣传为该公司迄今为止最先进的编码代理。
该模型使用混合专家(MoE)方法,从总共4800亿个参数中激活350亿个参数,并支持多达256,000个上下文令牌。据报道,使用特殊的推断技术,这个数字可以扩大到100万。该公司声称,Qwen3-Coder在代理任务方面优于其他开放模型,包括Moonshot AI和DeepSeek的版本。
但并非所有人都认为这是好消息。Cybernews的主编Jurgita Lapieny警告说,Qwen3-Coder可能不仅仅是一个有用的编码助手,如果被西方开发者广泛采用,它可能会给全球技术系统带来真正的风险。
披着开源外衣的木马?
阿里巴巴围绕Qwen3-Coder的信息一直专注于其技术实力,将其与OpenAI和Anthropic的顶级工具进行比较。但是,尽管基准分数和功能吸引了人们的注意力,Lapieny认为它们也可能会分散人们对真正问题的注意力:安全性。
这并不是说中国在人工智能方面正在迎头赶上——这已经是众所周知的了。更深层次的担忧是,使用难以检查或完全理解的人工智能系统生成的软件所隐藏的风险。
正如Lapieny所说,开发人员可能“梦游进入一个未来”,在这个未来中,核心系统在不知不觉中用易受攻击的代码构建。像Qwen3-Coder这样的工具可能会让生活变得更容易,但它们也可能会引入一些不为人知的微妙弱点。
这种风险不是假设的。Cybernews研究人员最近审查了美国主要公司的人工智能使用情况,发现327家标准普尔500现在公开报告使用人工智能工具。仅在这些公司中,研究人员就发现了近1000个与人工智能相关的漏洞。
增加另一个人工智能模型——特别是在中国严格的国家安全法下开发的人工智能模型——可能会增加另一层风险,一种更难控制的风险。
当代码成为后门
今天的开发人员严重依赖人工智能工具来编写代码,修复错误,并塑造应用程序的构建方式。这些系统快速、有用,并且每天都在变得更好。
但是如果同样的系统被训练来注入缺陷呢?不是明显的错误,而是不会触发警报的难以发现的小问题。一个看似无害的设计决策的漏洞可能多年都不会被发现。
供应链攻击通常就是这样开始的。过去的例子,如网络安全管理软件产品事件,表明长期渗透可以悄悄地和耐心地完成。有了足够的访问和上下文,人工智能模型可以学习如何种植类似的问题——特别是如果它接触了数百万个代码库。
这不仅仅是一个理论。根据中国国家情报法,阿里巴巴等公司必须配合政府要求,包括涉及数据和人工智能模型的要求。这就把话题从技术性能转移到了国家安全。
你的代码会怎么样?
另一个主要问题是数据暴露。当开发人员使用Qwen3-Coder这样的工具来编写或调试代码时,每一个交互都可能泄露敏感信息。
这可能包括专有算法、安全逻辑或基础设施设计——正是这种对外国有用的细节。
即使这个模型是开源的,仍然有很多用户看不到的东西。后端基础设施、遥测系统和使用跟踪方法可能不透明。这使得很难知道数据去了哪里,或者随着时间的推移模型可能会记住什么。
不受监督的自治
阿里巴巴还专注于代理人工智能——比标准助手更独立的模型。这些工具不只是建议代码行。他们可以被分配完整的任务,以最少的投入进行操作,并自己做出决定。
这听起来可能很有效率,但也会引发危险信号。一个能够扫描整个代码库并做出改变的完全自主的编码代理如果落入坏人之手,可能会变得很危险。
想象一下,一个代理可以理解一家公司的系统防御,并设计定制的攻击来利用它们。帮助开发人员更快行动的相同技能组合可能会被攻击者重新利用,以更快地行动。
监管仍未准备好
尽管有这些风险,目前的法规并没有以一种有意义的方式处理像Qwen3-Coder这样的工具。美国政府花了数年时间讨论与抖音等应用相关的数据隐私问题,但对外国开发的人工智能工具几乎没有公共监督。
美国外国投资委员会(CFIUS)等团体审查公司收购,但没有类似的程序来审查可能带来国家安全风险的人工智能模型。
拜登总统关于人工智能的行政命令主要集中在本土模型和一般安全实践上。但它忽略了对进口工具的担忧,这些工具可能会嵌入医疗、金融或国家基础设施等敏感环境。
能够编写或修改代码的人工智能工具应该像软件供应链威胁一样被严肃对待。这意味着为在哪里以及如何使用它们制定明确的指导方针。
接下来应该会发生什么?
为了降低风险,处理敏感系统的组织应该在将Qwen3-Coder或任何外国开发的代理人工智能集成到他们的工作流程之前暂停。如果你不会邀请你不信任的人来看你的源代码,为什么要让他们的人工智能重写呢?
安全工具也需要跟上。静态分析软件可能无法检测到人工智能制造的复杂后门或微妙的逻辑问题。该行业需要专门设计的新工具来标记和测试人工智能生成的代码中的可疑模式。
最后,开发者、技术领导者和监管者必须明白代码生成人工智能不是中立的。这些系统拥有强大的力量——既是有用的工具,也是潜在的威胁。使它们有用的相同特征也可能使它们变得危险。
Lapieny称Qwen3-Coder为“一匹潜在的特洛伊马”,这个比喻很合适。这不仅仅是生产力的问题。而是谁在门里面。
不是每个人都同意什么是重要的
阿里云的创始人王坚有不同的看法。在接受采访时彭博他说,创新不是雇佣最昂贵的人才,而是挑选能够创造未知的人。他批评了硅谷雇用人工智能的方式,现在科技巨头们在争夺顶级研究人员,就像运动队竞标运动员一样。
“你唯一需要做的就是找到合适的人,”王说。“不是真正的昂贵的人。”
他还认为,中国人工智能种族是健康的,而不是充满敌意的。王说,公司轮流领先,这有助于整个生态系统更快地增长。
“由于这场竞争,你可以拥有非常快速的技术迭代,”他说。“我不认为这很残忍,但我认为这很健康。”
尽管如此,开源竞争并不能保证信任。西方开发人员需要仔细考虑他们使用什么工具——以及谁构建了它们。
Qwen3-Coder可能提供令人印象深刻的性能和开放访问,但它的使用带来了超出基准和编码速度的风险。在一个人工智能工具正在塑造如何构建关键系统的时代,值得问的不仅仅是这些工具能做什么——而是当它们这样做时谁会受益。