
GPT-5.4 mini 和 nano 正式上线,编码能力达满血版 94%,速度提升 2 倍,价格低至 1/12,成为 AI Agent 开发的理想引擎
OpenAI 没有预热,直接扔出了两颗炸弹:GPT-5.4 mini 和 GPT-5.4 nano。这两个轻量级模型要解决的问题很明确——在生产环境里,怎么让 AI 又快又准又便宜地干活?

先看最炸裂的数字:
编码能力(SWE-Bench Pro):GPT-5.4 mini 拿下 54.4%,而满血版 GPT-5.4 是 57.7%,差距仅 3.3%。这意味着一个为速度和成本优化的小模型,在解决真实工程问题时,已经摸到了旗舰模型的天花板。
计算机使用(OSWorld-Verified):GPT-5.4 mini 72.1% 的成绩,媲美 GPT-5.4(75%)。能快速解析信息密集的 UI 截图,并做出正确操作决策。
速度提升:相较于上一代 GPT-5 mini,GPT-5.4 mini 运行速度直接飙升 2 倍。

网友直言:mini 和 nano 完全可以当做「龙虾」(AI Agent)的主力模型来用。
GPT-5.4 mini:
GPT-5.4 nano:
相较于 GPT-5.4,mini 输出价格是其 1/3,而 nano 价格只有 1/12。

有用户试用后惊叹:速度快,还要比 Claude 4.6 Opus 便宜 9 倍。
在 GPQA Diamond(博士级科学推理基准)上,GPT-5.4 mini 取得了 88% 的成绩,与 GPT-5.4 仅差 5%。
在 Toolathlon(复杂工具链测试)中,GPT-5.4 mini 得分 42.9%,完全碾压 GPT-5 mini(26.9%)。这意味着它能在多步骤任务中正确地组合、排序、使用多种工具。

OpenAI 提出的架构思路很清晰:旗舰模型 GPT-5.4 负责规划、协调和最终决策,然后把具体任务分发给 GPT-5.4 mini 子智能体并行执行。
搜索代码库、审查大型文件、处理支持文档,这些不需要「深度思考」但需要「快速完成」的工作,全部交给 mini。而且 mini 在 Codex 中只消耗 GPT-5.4 配额的 30%。

适合谁?
不适合谁?
相比竞品的优势:
明显的限制:
API:已全面开放,支持文本和图像输入、工具使用、函数调用、网络搜索、文件搜索、计算机使用等全套能力。
ChatGPT:免费用户和 Go 用户可通过菜单中的「Thinking」功能使用。付费用户在 GPT-5.4 Thinking 额度耗尽时,mini 会自动作为降级备选方案。
Codex:支持 GPT-5.4 制定整体方案,自动调度 mini 子智能体执行各个子任务。
快、强、便宜,三个词同时成立。这在半年之前是完全不可能的。对于 AI 应用开发者来说,GPT-5.4 mini 和 nano 的发布意味着产品的推理成本可以再降一个数量级,AI 的渗透速度将进一步加快。
阿里ATH事业群发布悟空WuKong,全球首个企业智能体AI原生工作平台,支持CLI化操作、RealDoc文件系统、十大行业OPT技能套件,解决OpenClaw企业落地难题

来自 Claude Code 团队工程师的一手经验,揭秘 Anthropic 内部几百个 Skills 的分类体系、编写技巧和分发策略

OpenAI团队用Codex Skills改造Agents SDK维护流程,通过AGENTS.md、本地技能和GitHub Actions,三个月PR合并量从316增至457,提升45%