Anthropic憋了两个月的神话级模型,终于来了——Claude Fable 5公测,Claude Mythos 5小范围开放。一个套了安全护栏面向所有人,一个是满血版只给少数授权机构。前沿AI真正进入"权限分级时代",能力越强,管控越严,这已经是绕不开的趋势了。
Anthropic在2026年6月9日同时发布了两款旗舰模型:Claude Fable 5和Claude Mythos 5
简单说清楚两者区别:Fable 5是加了安全护栏的Mythos级模型,面向所有付费用户开放;Mythos 5是不加限制的满血版,目前只在Project Glasswing框架下向已获批的机构开放,比如生物医药研究机构和网络安全专业组织。底层能力相同,权限不同。
能力这块,先看编程
在衡量真实软件工程问题的SWE-bench Pro评测里,Fable 5拿到了80.3%的高分。Opus 4.8是69.2%,GPT-5.5是58.6%,差距相当明显。Cognition的Frontier Code评测里,Fable 5在"中等推理强度"模式下得分是所有前沿模型里最高的——这个基准本身很难饱和,所以这个成绩含金量很高。
Stripe实测了一把:在5000万行Ruby代码库里做全库迁移,工程团队手动做需要两个多月,Fable 5用了一天。
视觉能力这次升级也很明显。在专注视觉文件推理的GDPpdf基准上,Fable 5和Mythos 5共同拿到了29.8%,Opus 4.8是22.5%,GPT-5.5是24.9%,Gemini 3.1 Pro只有16.7%。 Anthropic还放出了一个直观的Demo:让Fable 5纯靠原始游戏截图打通关《宝可梦·火红版》,没有地图外挂,没有任何外部脚手架,完全靠原生视觉推理自主通关。配上持久化文件记忆后,它玩《杀戮尖塔》的表现提升了3倍,到达最终章的概率也涨了3倍。
长任务和记忆,才是这代的真正重点
Anthropic把"Token效率"单独拿出来强调,是有道理的。越强的Agent模型,运行时间越长,消耗的Token就越多。如果模型能力很强但"话痨",成本会高到企业肉疼。Fable 5在强调能力的同时压Token消耗,本质是在解决Agent落地的账本问题。
在VibeCAD和物理研究机构的测试里,Fable 5用了1/3的推理Token,在36小时内产出的物理研究成果,逼近了GPT-5.5跑四天的成绩。
满血版Mythos 5在生物医药领域的表现更夸张。它在完全没有人类协助的情况下,独立完成了生物学家的全套工作流:选择蛋白质结合位点、调度运行生信工具、遭遇失败时自主Debug。设计出的14个蛋白质靶向复合物里,9个已进入真实药物研发管线。在基因组学研究中,Mythos 5自主工作一周多,整合138个物种的单细胞数据并训练了一个定制微型机器学习模型——这个体积小了100倍的模型,在表现上击败了近期发表在《Science》上的最新研究成果。
安全机制这次做成了产品架构
这是Fable 5最有意思的地方,也是最值得关注的变化。
过去的大模型在安全上的做法是让模型直接拒绝,说一句"抱歉我无法帮你"。Fable 5换了思路——它不做单纯拒绝,而是做模型路由。
Fable 5背后挂了一组独立分类器,持续检测请求是否涉及网络安全攻击、生物和化学风险、以及模型蒸馏这三类高风险领域。一旦触发,系统不是让Fable 5拒绝回答,而是自动把请求路由给Claude Opus 4.8处理,并告知用户发生了降级。Anthropic的逻辑是:Opus 4.8本身也是强模型,降级回答总比直接拒绝体验好。
官方数据显示,超过95%的Fable 5会话不会触发降级。也就是说,日常写作、代码、分析、研究这些任务,你拿到的体验基本接近Mythos 5满血版。
但代价来了。从Mythos级模型开始,Anthropic要求所有相关流量强制保留30天,覆盖第一方和第三方使用场景。官方声明数据只用于安全监控,不用于训练。对普通用户来说这可能只是条款里的一行字,但对企业客户来说就是现实的数据治理合规问题。
此外,分类器当前调得比较保守,可能误伤合理请求——比如生物学家研究病毒、安全工程师做授权攻防演练。Anthropic自己也承认这一点,后续会降低误伤率。
价格和使用窗口
Fable 5和Mythos 5统一定价:每百万输入Token 10美元,每百万输出Token 50美元,开启提示词缓存可打9折。相比Claude Mythos Preview已经砍了一半以上,但仍然是高价模型,随便烧不太现实。
使用窗口要注意:今天到6月22日,Pro、Max、Team和企业版订阅用户可以免费用Fable 5。6月23日起,使用Fable 5需要额外购买usage credits。Anthropic表示产能跟上后会重新把Fable 5做成订阅标配,API和按量付费的企业用户不受这个节奏影响,今天起照常调用。
从"巫师"变成"甲方"
沃顿商学院教授Ethan Mollick在率先拿到测试权限后写了一篇长文,说他使用Fable 5的感觉已经不像操作工具,更像是在委托一个小型工作室。
他让Fable 5做了一个等时圈地图。Fable 5自己启动多个代理查了2200多个具体航班信息、TGV和新干线铁路数据、各国道路速度,最后整合成一个完整的地图项目。他向Fable 5提交了一份15页的复杂项目设计文档,9个多小时后,一个高质量成品直接交付——中间他一次都没有介入。
他的感受是:以前用大模型像个"巫师",要精雕细琢每一句Prompt才能念出效果;现在面对Mythos级模型,人类更像"甲方",委托任务、验收成品,过程不用管。AI越像承包方,人类就越需要具备验收能力。
愉悦之处在于,你只需提出要求,它就能实现。不安之处也在于,你只需提出要求,它就能实现。
Anthropic先给它系上安全带,再把钥匙递给所有人。Fable 5代表的不只是一次模型能力跃升,更是前沿AI进入"权限分级、安全架构化"新阶段的明确信号。能力越强,管控越深,这是Anthropic给这个时代定下的节奏。