Anthropic发布Claude Fable 5与Mythos 5双版本,SWE-bench Pro得分80.3%,API定价输入$10/百万Token,限时免费至6月22日。


Anthropic发布Claude Fable 5与Mythos 5双版本,SWE-bench Pro得分80.3%,API定价输入$10/百万Token,限时免费至6月22日。
Anthropic发布了Claude Fable 5和Claude Mythos 5,这是目前最强的Claude模型。Fable 5面向所有用户开放,Mythos 5仅限受信任用户。发布24小时内即登顶Agent Arena榜单,创下AI史上最大分差纪录。
两者是同一个底层模型的两个版本。基础技术指标完全一致,区别只在安全护栏。
在SWE-bench Pro评测中,Fable 5得分80.3%,对比GPT-5.5的58.6%。在Stripe的5000万行Ruby代码库中,Fable 5用一天完成了原本需要两个月的全库迁移。
在Cognition的Frontier Code评测中,Fable 5在中等推理强度下拿到前沿模型最高分。
开发者实测中的亮点案例:

Fable 5实现了"原生视觉盲打"。仅凭游戏屏幕截图,在没有任何外挂辅助的情况下,自主打通了《宝可梦 火红版》。
在百万级Token的长期任务里保持专注,利用文件级记忆改进输出。接入持久化文件记忆后,《杀戮尖塔》游戏表现提升3倍。
Mythos 5在生物医药领域能独立执行完整生物学家工作流。设计出的14个蛋白质靶向复合物中,9个已进入实验室真实药物研发管线。
| 项目 | 价格 |
|---|---|
| 输入Token | $10 / 百万 |
| 输出Token | $50 / 百万 |
对比Opus 4.8定价翻倍,但实际Token消耗也更大。沃顿商学院教授Ethan Mollick实测后表示Token消耗非常快。
限时免费窗口:6月22日前,Pro、Max、Team和企业版用户可免费用Fable 5。6月23日起需额外购买usage credits。API和按量付费的企业客户不受此节奏影响。
Fable 5背后挂了一组独立分类器,检测请求是否涉及网络安全攻击、生物化学风险和模型蒸馏。一旦触发,自动降级到Opus 4.8回答,而非直接拒绝。
超过95%的会话不会触发降级。但分类器偏保守,生物学家研究病毒、安全工程师做授权攻防演练等合理任务也可能被误伤。Anthropic表示后续会降低误伤率。

美团旗下GN06团队发布AI浏览器Tabbit 1.0,基础功能永久免费,专业版9.9元/周,支持多模型同时运行、脚本妙招和Agent任务管理。

来自Anthropic官方的Skill编写经验总结:精简上下文、积累踩坑清单、脚本化稳定环节,让你的AI协作效率翻倍。

OpenAI官方更新十几个Codex真实工作流案例,涵盖Computer Use、/goal长期目标、PPT生成、游戏开发等实用场景,手把手教你高效使用Codex。