Claude 4.5有多厉害?Claude把价格打下来了?

2025-12-29 21:20
100
前段时间,Anthropic正式发布了Claude Sonnet 4.5,对它的定位是“世界上最好的编码模型”和“构建复杂智能体的最强模型”。
凭什么这么说呢,Anthropic在客户测试中观察到,Claude 4.5能连续专注干活超过30小时,而上一代的数据是7个小时。以前是代替1个程序员,现在可以代替4个了呢。


Claude 4.5有多厉害?

Hugging Face和一些行业测试那边刚出了新数据,Anthropic家的Claude 4.5,特别是那个Opus 4.5版,在写代码这事上,算是立了个新flag。它在SWE-bench这个号称“真实世界编程问题”的试金石上,拿了80.9%的分,简直了,这可是有史以来第一个冲破80%大关的模型,一下子就把GPT-5.1(76.3%)和Gemini 3 Pro(76.2%)甩在后面了。
这事儿牛就牛在,Claude Opus 4.5在Anthropic他们公司内部的招聘测试里,分数已经比所有来面试的人类工程师都高了。不只是解决GitHub上的实际问题厉害,它在好几个专业测试里也基本是霸榜的存在:
命令行操作(Terminal-Bench):拿了59.3%的分,把其他对手都比下去了,说明它搞起自动化脚本和环境操作来,确实有一手。
Web开发实战(Code Arena):这个测试是由真人开发者来评判的,结果它干掉了Gemini 3 Pro,爬到了榜首。
多语言编码(SWE-bench Multilingual):测了8种主流编程语言,它在其中7种上都排在最前面。

Claude把价格打下来了?


此前,Claude的使用成本极高,频繁调用甚至可能导致用户面临重大经济负担。然而,当前其使用成本已实现显著优化,开发者不需要再因为token的问题而过于精打细算了。
对于需高频调用API的开发者群体而言,整体使用成本降幅高达三分之二。具体而言,输入token单价已从15美元下调至5美元,输出token单价则由75美元大幅降至25美元。
最为显著的是,缓存机制在成本效益方面展现出更为突出的优势。具体而言,5M缓存写入服务仅需6.25美元,1小时缓存写入服务定价为10美元,而缓存命中及刷新操作的单价仅为0.5美元。这一价格体系意味着:若你的应用程序存在高频调用相同上下文的业务场景,将能够实现更低的运营成本。
通过对比Opus 4.1与Opus 4的定价策略可见,此前两者的基础定价均为15美元起,而当前价格已实现大幅下调。因此可以说这一次的Opus 4.5版本真的是性价比之王。
未来,大模型应该把推理再降低一下,这样人人都用得起AI的时代将会到来。
0
好文章,需要你的鼓励