Claude Sonnet 4.6 发布:中端价格享旗舰级能力,百万 token 上下文重塑 AI 成本格局

2026-02-22 20:53
48
Anthropic正式推出重磅模型Claude Sonnet 4.6,定位“史上最强Sonnet模型”,在编程、计算机使用、长上下文推理等核心场景实现全面升级。该模型以中端定价提供接近旗舰Opus系列的性能,同时搭载100万token上下文窗口(Beta版),现已面向全场景开放,彻底重塑AI行业成本性能比格局。

一、核心亮点:全维度升级,性能逼近旗舰级
1.六大核心能力全面迭代
编程能力:SWE-bench Verified基准测试得分79.6%,仅略低于旗舰Opus 4.6(80.8%);能更高效理解代码上下文,整合共享逻辑而非简单复制,减少过度工程化与“偷懒”行为,开发者偏好度较前代Sonnet 4.5提升至70%,甚至59%的场景下优于Opus 4.5。
计算机使用:OSWorld-Verified基准得分72.5%,接近人类水平,16个月内从14.9%提升五倍;可像人类一样通过点击、打字操作Chrome、LibreOffice、VS Code等软件,轻松处理复杂电子表格、多步骤网页表单,支持多浏览器标签页信息整合,抵御提示注入攻击的能力大幅提升,表现比肩Opus 4.6。
长上下文推理:100万token上下文窗口可容纳完整代码库、长篇合同或数十篇研究论文,且能高效跨上下文推理,长程规划能力突出。
智能体规划与知识工作:GDPval-AA办公任务测试ELO得分1633,略超Opus 4.6(1606),成为该榜单新榜首;金融分析(Finance Agent v1得分63.3%)、跨学科推理等场景表现领先同类模型。
设计能力:视觉输出更精致,布局、动画与设计感显著提升,减少生产级结果所需迭代轮次。
2.长程规划能力亮眼
在Vending-Bench Arena模拟业务运营评估中,Sonnet 4.6展现出高阶策略思维:前期大力投资产能,后期精准转向盈利,最终业绩远超前代Sonnet 4.5,凸显其在复杂长任务中的决策与执行能力。
二、定价与开放范围:成本优势凸显,全场景覆盖
1.定价保持亲民,性价比碾压旗舰
价格与Sonnet 4.5完全一致:每百万输入token 3美元、每百万输出token 15美元,仅为旗舰Opus系列(输入15美元/百万token、输出75美元/百万token)的五分之一,大幅降低企业大规模部署AI智能体的成本。
价值重构:让企业无需为优质性能支付高昂费用,每天数百万次API调用的场景下,彻底消除“低成本低质”与“高成本高质”的两难选择。
2.全场景开放,默认升级无门槛
开放范围:覆盖Claude免费版/Pro版、Claude Cowork、Claude Code、API及Amazon Bedrock、Google Cloud Vertex AI等主流云平台;
便捷使用:claude.ai默认升级为该模型,开发者可通过API标识符“claude-sonnet-4-6”快速接入,支持自适应思考、扩展思考模式,联网搜索、代码执行、记忆功能全量开放。
三、行业影响:成本性能比革命,加速企业AI落地
Claude Sonnet 4.6的发布对AI行业具有变革性意义:
成本重构:中端定价匹配旗舰级性能,让中小企业与开发者以低门槛享受高质量AI服务,推动AI智能体大规模普及;
场景突破:计算机使用能力接近人类水平,无需定制连接器即可自动化遗留软件(如保险门户、政府数据库),拓展AI在企业办公中的应用边界;
生态赋能:Anthropic借此次发布加速进军企业市场,近期已完成300亿美元融资(估值达3800亿美元),并与印度IT巨头Infosys达成合作,将Claude整合至Topaz AI平台,进一步扩大行业影响力。
该模型的推出不仅展现了Anthropic在AI技术上的快速迭代能力,更以“低成本+高性能”的组合拳,重新定义了中端AI模型的价值标准,为2026年AI行业竞争注入新变量。
0
好文章,需要你的鼓励