Anthropic 发布 Claude Opus 4.6:AI 编程与推理能力再升级
2026-02-06 11:16
102
Anthropic 于今日正式发布 Claude Opus 4.6,这是其最智能的 AI 模型的最新升级版本。新版本在编程能力、推理规划和长文本处理方面实现了显著提升,并首次为 Opus 级别模型引入了 100 万 token 的上下文窗口。

核心升级亮点
Claude Opus 4.6 在前代基础上带来了多项重要改进:
- 编程能力增强:更擅长代码审查和调试,能够自主发现并修正错误
- 规划能力优化:能够更谨慎地规划复杂任务,将大任务分解为可执行的子任务
- 长任务持续性:可持续执行代理任务更长时间,在大型代码库中运行更可靠
- 超长上下文:首次支持 100 万 token 上下文窗口(Beta 版),大幅提升长文档处理能力
- 自适应思考:新增自适应思考模式,模型可根据任务复杂度动态调整推理深度
性能表现
在多项权威评测中,Claude Opus 4.6 展现了业界领先的性能:
- Terminal-Bench 2.0:在代理编程评测中取得最高分
- Humanity's Last Exam:在复杂多学科推理测试中领先所有前沿模型
- GDPval-AA:在金融、法律等高价值知识工作领域,比 OpenAI GPT-5.2 高出约 144 Elo 分,比 Claude Opus 4.5 高出 190 分
- BrowseComp:在网络信息检索能力评测中表现最佳
全新功能特性
Agent Teams(代理团队)
在 Claude Code 中,用户可以组建「代理团队」,让多个 AI 代理协同工作完成复杂任务。这一功能特别适用于大型软件开发和复杂项目管理场景。
Office 集成
Claude Opus 4.6 大幅升级了 Excel 集成能力,并推出 PowerPoint 集成的研究预览版。用户可以直接在 Office 文档中与 Claude 交互,完成数据分析、演示文稿制作等日常办公任务。
Cowork 自主多任务
在 Cowork 环境中,Claude Opus 4.6 可以自主执行多任务,包括运行财务分析、开展研究、创建和编辑文档、表格和演示文稿,无需人工持续干预。
行业合作伙伴评价
"Claude Opus 4.6 是 Anthropic 发布的最强模型。它能够接受复杂请求并真正跟进执行,将任务分解为具体步骤并产出精致成果。对 Notion 用户来说,它更像是一个有能力协作者而非单纯工具。"
— Sarah Sachs,Notion AI 负责人
"早期测试显示 Claude Opus 4.6 能够胜任开发者每天面临的复杂多步编程工作,特别是需要规划和工具调用的代理式工作流。这开始解锁前沿领域的长周期任务。"
— Mario Rodriguez,GitHub 首席产品官
可用性与定价
Claude Opus 4.6 现已正式上线,用户可通过以下渠道访问:
- claude.ai 网页版
- Claude API:使用模型代号
claude-opus-4-6
- 云平台:所有主流云平台均已上线
API 定价保持不变:输入 $5/百万 token,输出 $25/百万 token。开发者可通过 effort 参数控制模型的思考深度,在高智能与低成本之间灵活选择。
随着 Claude Opus 4.6 的发布,Anthropic 继续巩固其在企业级 AI 助手领域的领先地位。新版本在编程、推理和长文本处理方面的突破,将为开发者和知识工作者带来更高效的 AI 协作体验。
0
好文章,需要你的鼓励
