6 月 9 日,Anthropic 正式发布两款新一代旗舰大模型Claude Fable 5与Claude Mythos 5。两款模型基于同一核心技术打造,仅通过不同安全护栏区分应用场景,在编程、知识工作、科学研究等 10 余项权威基准测试中全面超越前代及竞品,成为当前全球性能最强的通用 AI 模型。
一、双模型差异化定位,覆盖通用与高敏感场景
本次发布采用 “同源双轨” 策略,精准匹配不同用户需求:
Claude Fable 5 面向全体用户开放,定位为目前公开可用能力最强的 Claude 模型,支持通用办公、开发、创作等全场景;
Claude Mythos 5 则延续 Project Glasswing 项目定向开放模式,仅向网络安全防御机构、基础设施提供商及少量顶尖生物研究者开放,聚焦高敏感科研与安全领域。
两款模型核心能力完全一致,差异仅在于安全防护策略的严格程度。
二、全维度能力碾压,多基准测试登顶
实测数据显示,Fable 5/Mythos 5 在核心指标上全面领先行业:
编程能力断层式突破,SWE-Bench Pro 得分达 80.3%,远超 Claude Opus 4.8 的 69.2% 与 GPT 5.5 的 58.6%;
高难度 FrontierCode 测试中,以 29.3% 的成绩碾压 GPT 5.5 的 5.7%。
知识工作领域,GDPVal-AA 评分达 1932,文档图表理解能力提升 32%,可直接从截图重建完整网页源码。此外,模型在计算机操控、多学科推理、医疗诊断等维度均位居第一,自主运行时长也创下 Claude 系列历史新高。
三、场景化安全设计,兼顾性能与风险管控
为平衡高性能与安全性,Anthropic 为两款模型定制了差异化防护体系。
Fable 5 采用保守安全策略,新增专项分类器系统,自动拦截网络攻击、生物化学合成、模型蒸馏等高风险请求,命中后自动降级为 Claude Opus 4.8 响应。
Mythos 5 则保留完整能力,在网络安全领域展现出全球顶尖实力,可发现并修复高危系统漏洞;科研场景中,其将药物设计流程提速 10 倍,在 14 个蛋白靶点中成功产出 9 个强候选分子,80% 的生物学家更偏好其研究结论。
四、定价与开放节奏,推动技术普惠
两款模型采用统一定价标准:每百万输入 token 收费 10 美元,每百万输出 token 收费 50 美元。
目前 Claude Fable 5 已在 Anthropic 官网及 API 平台全面上线,所有用户均可立即体验;Claude Mythos 5 暂不对外开放,仅通过邀请制向 Glasswing 合作伙伴及符合资质的科研机构提供服务。
此次发布标志着 Anthropic 进一步巩固了大模型行业的领先地位,也验证了长时自主任务能力将成为下一代 AI 的核心竞争力。随着模型性能持续突破,AI 在复杂工程、科学研究等领域的落地应用将迎来加速期。