Anthropic 发布 Claude Opus 4.6:AI 编程与推理能力再升级

2026-02-06 11:16
102
Anthropic 于今日正式发布 Claude Opus 4.6,这是其最智能的 AI 模型的最新升级版本。新版本在编程能力、推理规划和长文本处理方面实现了显著提升,并首次为 Opus 级别模型引入了 100 万 token 的上下文窗口。


核心升级亮点

Claude Opus 4.6 在前代基础上带来了多项重要改进:
  • 编程能力增强:更擅长代码审查和调试,能够自主发现并修正错误
  • 规划能力优化:能够更谨慎地规划复杂任务,将大任务分解为可执行的子任务
  • 长任务持续性:可持续执行代理任务更长时间,在大型代码库中运行更可靠
  • 超长上下文:首次支持 100 万 token 上下文窗口(Beta 版),大幅提升长文档处理能力
  • 自适应思考:新增自适应思考模式,模型可根据任务复杂度动态调整推理深度

性能表现

在多项权威评测中,Claude Opus 4.6 展现了业界领先的性能:
  • Terminal-Bench 2.0:在代理编程评测中取得最高分
  • Humanity's Last Exam:在复杂多学科推理测试中领先所有前沿模型
  • GDPval-AA:在金融、法律等高价值知识工作领域,比 OpenAI GPT-5.2 高出约 144 Elo 分,比 Claude Opus 4.5 高出 190 分
  • BrowseComp:在网络信息检索能力评测中表现最佳

全新功能特性

Agent Teams(代理团队)

在 Claude Code 中,用户可以组建「代理团队」,让多个 AI 代理协同工作完成复杂任务。这一功能特别适用于大型软件开发和复杂项目管理场景。

Office 集成

Claude Opus 4.6 大幅升级了 Excel 集成能力,并推出 PowerPoint 集成的研究预览版。用户可以直接在 Office 文档中与 Claude 交互,完成数据分析、演示文稿制作等日常办公任务。

Cowork 自主多任务

在 Cowork 环境中,Claude Opus 4.6 可以自主执行多任务,包括运行财务分析、开展研究、创建和编辑文档、表格和演示文稿,无需人工持续干预。

行业合作伙伴评价

"Claude Opus 4.6 是 Anthropic 发布的最强模型。它能够接受复杂请求并真正跟进执行,将任务分解为具体步骤并产出精致成果。对 Notion 用户来说,它更像是一个有能力协作者而非单纯工具。"
— Sarah Sachs,Notion AI 负责人
"早期测试显示 Claude Opus 4.6 能够胜任开发者每天面临的复杂多步编程工作,特别是需要规划和工具调用的代理式工作流。这开始解锁前沿领域的长周期任务。"
— Mario Rodriguez,GitHub 首席产品官

可用性与定价

Claude Opus 4.6 现已正式上线,用户可通过以下渠道访问:
  • claude.ai 网页版
  • Claude API:使用模型代号 claude-opus-4-6
  • 云平台:所有主流云平台均已上线
API 定价保持不变:输入 $5/百万 token,输出 $25/百万 token。开发者可通过 effort 参数控制模型的思考深度,在高智能与低成本之间灵活选择。
随着 Claude Opus 4.6 的发布,Anthropic 继续巩固其在企业级 AI 助手领域的领先地位。新版本在编程、推理和长文本处理方面的突破,将为开发者和知识工作者带来更高效的 AI 协作体验。
0
好文章,需要你的鼓励