Claude 4.5有多厉害？Claude把价格打下来了？

2025-12-29 21:20

100

前段时间，Anthropic正式发布了Claude Sonnet 4.5，对它的定位是“世界上最好的编码模型”和“构建复杂智能体的最强模型”。

凭什么这么说呢，Anthropic在客户测试中观察到，Claude 4.5能连续专注干活超过30小时，而上一代的数据是7个小时。以前是代替1个程序员，现在可以代替4个了呢。

Claude 4.5有多厉害？

Hugging Face和一些行业测试那边刚出了新数据，Anthropic家的Claude 4.5，特别是那个Opus 4.5版，在写代码这事上，算是立了个新flag。它在SWE-bench这个号称“真实世界编程问题”的试金石上，拿了80.9%的分，简直了，这可是有史以来第一个冲破80%大关的模型，一下子就把GPT-5.1（76.3%）和Gemini 3 Pro（76.2%）甩在后面了。

这事儿牛就牛在，Claude Opus 4.5在Anthropic他们公司内部的招聘测试里，分数已经比所有来面试的人类工程师都高了。不只是解决GitHub上的实际问题厉害，它在好几个专业测试里也基本是霸榜的存在：

命令行操作(Terminal-Bench):拿了59.3%的分，把其他对手都比下去了，说明它搞起自动化脚本和环境操作来，确实有一手。

Web开发实战(Code Arena):这个测试是由真人开发者来评判的，结果它干掉了Gemini 3 Pro，爬到了榜首。

多语言编码(SWE-bench Multilingual):测了8种主流编程语言，它在其中7种上都排在最前面。

Claude把价格打下来了？

此前，Claude的使用成本极高，频繁调用甚至可能导致用户面临重大经济负担。然而，当前其使用成本已实现显著优化，开发者不需要再因为token的问题而过于精打细算了。

对于需高频调用API的开发者群体而言，整体使用成本降幅高达三分之二。具体而言，输入token单价已从15美元下调至5美元，输出token单价则由75美元大幅降至25美元。

最为显著的是，缓存机制在成本效益方面展现出更为突出的优势。具体而言，5M缓存写入服务仅需6.25美元，1小时缓存写入服务定价为10美元，而缓存命中及刷新操作的单价仅为0.5美元。这一价格体系意味着：若你的应用程序存在高频调用相同上下文的业务场景，将能够实现更低的运营成本。

通过对比Opus 4.1与Opus 4的定价策略可见，此前两者的基础定价均为15美元起，而当前价格已实现大幅下调。因此可以说这一次的Opus 4.5版本真的是性价比之王。

未来，大模型应该把推理再降低一下，这样人人都用得起AI的时代将会到来。

好文章，需要你的鼓励