大规模封号潮席卷用户后,Anthropic推出定价更低的Claude Sonnet 5,这款模型虽看齐高端Opus的智能体能力、下调API计价,但存在token计量上浮、实际性能提升有限的短板,也没能解决平台风控严苛、频繁封禁账号的核心痛点。
一、封号问题愈演愈烈,成本短板迎来新品回应
你近期大概率能感受到Claude两大长期槽点,风控无差别封号、使用成本偏高,过去一周大量用户都踩中封号雷区。社交平台到处都是关于Anthropic风控离谱规则的讨论,异地登录、IP切换都会触发账号审查,甚至有用户提醒别随意点开官方推送邮件,平台会依据邮件打开地址判定账号归属地,相关传闻细节暂无法全部核实,但平台高频封号已是所有人都能证实的现状,不少人接连多个账号接连被封禁。
Anthropic这次用全新Sonnet 5回应成本过高的问题,官方将其定义为智能体能力最强的Sonnet系列模型,支持自主规划任务、调用浏览器与终端工具,独立完成复杂多步骤工作。品牌试图把原本只属于高端Opus模型的核心能力下放至平价Sonnet产品线,这次更新不只是单纯强化模型性能,更是在平衡产品使用体验与使用成本。
二、Sonnet 5主打平替高端Opus,实际提升感知不强
Sonnet系列本是普通开发者入门Claude的核心选择,前代3.5、3.6、3.7版本,让大量开发者把AI融入代码编写、工具调用、长文本处理流程,大众对AI智能体的初步认知基本都来自Sonnet模型。此前一年Anthropic的性能迭代重心全放在Opus高端线,Opus推理上限更高,收费也同步拉高,Sonnet虽仍是日常主力,可在复杂推理、长期任务执行、多工具联动等高难度场景,和Opus的差距越拉越大,Sonnet 5的推出就是为抹平这份性能鸿沟。
官方数据显示,Sonnet 5对比Sonnet 4.6在推理、编程、知识处理、工具调用维度全面升级,综合实力贴近Opus 4.8,定价却大幅压低。产品划分清晰,Opus 4.8留给对输出精准度要求极高的场景,Sonnet 5则提供低成本、接近顶配水准的替代方案。实际上手体验很难直观察觉到性能质变,反倒有种品牌为压缩算力开支,仓促打包智能体概念上线新品的观感。
三、定价有优惠,但token规则暗藏隐性成本
API定价设置限时优惠窗口,2026年8月31日前,输入百万token仅收取2美元,输出百万token收费10美元;9月1日恢复标准定价,输入、输出单价分别涨到3美元、15美元。拿来和Opus 4.8对比,后者输入百万token5美元、输出25美元,巨大价差意在引导开发者放弃Opus大规模落地,转向Sonnet 5部署业务。
低价标价不等于整体开销会大幅缩水,官方藏在页面注释里说明,Sonnet 5更换全新分词器,同等文本会生成1至1.35倍数量的token,浮动幅度随文本类型变化。
核算成本时不能只看单token标价,还要结合自身业务的token消耗量、缓存命中比例、输出文本长度综合计算,这也是品牌反复强调性能成本曲线的原因。Sonnet 5不会完全替代Opus,只是让多数常规任务能以更低开销拿到接近高端模型的智能体功能。
普通用户端同步开放Sonnet 5,免费、付费Pro套餐默认切换该模型,Max、团队、企业版用户也能自由选用,模型同步接入Claude代码工具与开发平台,开发者通过专属接口标识符即可调用。
四、安全能力小幅升级,高危攻防能力仍有明显短板
安全能力是本次更新重点宣传内容,Sonnet 5拒绝恶意提问、抵御提示注入的表现优于Sonnet 4.6,文本幻觉、刻意迎合用户的问题有所减少,自动化安全检测里违规输出概率更低,但整体安全上限依旧比不上Opus 4.8与Mythos预览版。
模型没有针对高危网络攻防场景专项训练,仅能处理基础合规的网络安全工作,高危漏洞开发评测里表现远弱于Opus和Mythos 5。
拿Firefox 147漏洞测试举例,Sonnet 4.6和Sonnet 5都无法生成完整可运行漏洞利用代码,后者小幅提升的测试成功率,只是通用推理能力附带效果,并非定向强化攻击能力。
平台给Sonnet 5默认开启网络安全拦截机制,实时识别阻断高危使用请求,官方判定它安全风险偏低,防护力度弱于Fable 5。
五、新品更像面向资本市场的阶段性答卷
单看产品迭代,Sonnet 5只是常规版本更新,放在当下封号风波未平息的节点发布,用意就不单纯是更新模型。这款低价新模型,更像是Anthropic递交给开发者、企业客户以及IPO资本市场的一份业绩答卷。
封号问题依旧没有配套优化方案,低价新模型没法抹平严苛风控带来的使用门槛,你一边要承担隐性上涨的token损耗成本,一边还要持续面临账号封禁的风险,这次更新很难彻底扭转大众对Claude的负面印象。