OpenAI 突袭发布 GPT-5.4 mini 和 nano：1/3 价格，性能逼近满血版

OpenAI 没有预热，直接扔出了两颗炸弹：GPT-5.4 mini 和 GPT-5.4 nano。这两个轻量级模型要解决的问题很明确——在生产环境里，怎么让 AI 又快又准又便宜地干活？

GPT-5.4 mini 和 nano 发布

核心亮点：小模型也能干大事

先看最炸裂的数字：

编码能力（SWE-Bench Pro）：GPT-5.4 mini 拿下 54.4%，而满血版 GPT-5.4 是 57.7%，差距仅 3.3%。这意味着一个为速度和成本优化的小模型，在解决真实工程问题时，已经摸到了旗舰模型的天花板。

计算机使用（OSWorld-Verified）：GPT-5.4 mini 72.1% 的成绩，媲美 GPT-5.4（75%）。能快速解析信息密集的 UI 截图，并做出正确操作决策。

速度提升：相较于上一代 GPT-5 mini，GPT-5.4 mini 运行速度直接飙升 2 倍。

性能对比

网友直言：mini 和 nano 完全可以当做「龙虾」（AI Agent）的主力模型来用。

定价：性价比拉满

GPT-5.4 mini：

输入：0.75 美元/百万 token
输出：4.5 美元/百万 token
上下文：400k

GPT-5.4 nano：

输入：0.2 美元/百万 token
输出：1.25 美元/百万 token

相较于 GPT-5.4，mini 输出价格是其 1/3，而 nano 价格只有 1/12。

定价对比

有用户试用后惊叹：速度快，还要比 Claude 4.6 Opus 便宜 9 倍。

工具调用与推理：博士级表现

在 GPQA Diamond（博士级科学推理基准）上，GPT-5.4 mini 取得了 88% 的成绩，与 GPT-5.4 仅差 5%。

在 Toolathlon（复杂工具链测试）中，GPT-5.4 mini 得分 42.9%，完全碾压 GPT-5 mini（26.9%）。这意味着它能在多步骤任务中正确地组合、排序、使用多种工具。

工具调用能力

子智能体架构：大模型决策，小模型执行

OpenAI 提出的架构思路很清晰：旗舰模型 GPT-5.4 负责规划、协调和最终决策，然后把具体任务分发给 GPT-5.4 mini 子智能体并行执行。

搜索代码库、审查大型文件、处理支持文档，这些不需要「深度思考」但需要「快速完成」的工作，全部交给 mini。而且 mini 在 Codex 中只消耗 GPT-5.4 配额的 30%。

子智能体架构

Toolin 实测评价

适合谁？

需要高频调用 AI 的开发者（成本敏感）
构建 AI Agent 应用的团队（速度 + 工具调用能力）
需要处理编码、数据提取、分类等任务的场景

不适合谁？

需要处理超长文档（64K+ 上下文）的场景：mini 在长上下文处理上与旗舰版差距明显
需要最顶级推理能力的复杂任务

相比竞品的优势：

比 Claude 4.6 Opus 便宜 9 倍，速度更快
计算机使用能力（72.1%）远超上一代 GPT-5 mini（42%）
工具调用能力大幅提升，适合 Agent 开发

明显的限制：

长上下文处理是短板：在 64K-128K 窗口下，mini 只有 47.7%，而 GPT-5.4 有 86%
nano 在计算机使用任务上表现一般（39%），不适合需要视觉推理的场景

如何使用

API：已全面开放，支持文本和图像输入、工具使用、函数调用、网络搜索、文件搜索、计算机使用等全套能力。

ChatGPT：免费用户和 Go 用户可通过菜单中的「Thinking」功能使用。付费用户在 GPT-5.4 Thinking 额度耗尽时，mini 会自动作为降级备选方案。

Codex：支持 GPT-5.4 制定整体方案，自动调度 mini 子智能体执行各个子任务。

快、强、便宜，三个词同时成立。这在半年之前是完全不可能的。对于 AI 应用开发者来说，GPT-5.4 mini 和 nano 的发布意味着产品的推理成本可以再降一个数量级，AI 的渗透速度将进一步加快。

GPT-5.4 mini 和 nano 发布

核心亮点：小模型也能干大事

先看最炸裂的数字：

计算机使用（OSWorld-Verified）：GPT-5.4 mini 72.1% 的成绩，媲美 GPT-5.4（75%）。能快速解析信息密集的 UI 截图，并做出正确操作决策。

速度提升：相较于上一代 GPT-5 mini，GPT-5.4 mini 运行速度直接飙升 2 倍。

性能对比

网友直言：mini 和 nano 完全可以当做「龙虾」（AI Agent）的主力模型来用。

定价：性价比拉满

GPT-5.4 mini：

输入：0.75 美元/百万 token
输出：4.5 美元/百万 token
上下文：400k

GPT-5.4 nano：

输入：0.2 美元/百万 token
输出：1.25 美元/百万 token

相较于 GPT-5.4，mini 输出价格是其 1/3，而 nano 价格只有 1/12。

定价对比

有用户试用后惊叹：速度快，还要比 Claude 4.6 Opus 便宜 9 倍。

工具调用与推理：博士级表现

在 GPQA Diamond（博士级科学推理基准）上，GPT-5.4 mini 取得了 88% 的成绩，与 GPT-5.4 仅差 5%。

在 Toolathlon（复杂工具链测试）中，GPT-5.4 mini 得分 42.9%，完全碾压 GPT-5 mini（26.9%）。这意味着它能在多步骤任务中正确地组合、排序、使用多种工具。

工具调用能力

子智能体架构：大模型决策，小模型执行

OpenAI 提出的架构思路很清晰：旗舰模型 GPT-5.4 负责规划、协调和最终决策，然后把具体任务分发给 GPT-5.4 mini 子智能体并行执行。

子智能体架构

Toolin 实测评价

适合谁？

需要高频调用 AI 的开发者（成本敏感）
构建 AI Agent 应用的团队（速度 + 工具调用能力）
需要处理编码、数据提取、分类等任务的场景

不适合谁？

需要处理超长文档（64K+ 上下文）的场景：mini 在长上下文处理上与旗舰版差距明显
需要最顶级推理能力的复杂任务

相比竞品的优势：

比 Claude 4.6 Opus 便宜 9 倍，速度更快
计算机使用能力（72.1%）远超上一代 GPT-5 mini（42%）
工具调用能力大幅提升，适合 Agent 开发

明显的限制：

长上下文处理是短板：在 64K-128K 窗口下，mini 只有 47.7%，而 GPT-5.4 有 86%
nano 在计算机使用任务上表现一般（39%），不适合需要视觉推理的场景

如何使用

API：已全面开放，支持文本和图像输入、工具使用、函数调用、网络搜索、文件搜索、计算机使用等全套能力。

ChatGPT：免费用户和 Go 用户可通过菜单中的「Thinking」功能使用。付费用户在 GPT-5.4 Thinking 额度耗尽时，mini 会自动作为降级备选方案。

Codex：支持 GPT-5.4 制定整体方案，自动调度 mini 子智能体执行各个子任务。

全部

AI教程

AI产品

AI资源

OpenAI 突袭发布 GPT-5.4 mini 和 nano：1/3 价格，性能逼近满血版

OpenAI 突袭发布 GPT-5.4 mini 和 nano：1/3 价格，性能逼近满血版

核心亮点：小模型也能干大事

定价：性价比拉满

工具调用与推理：博士级表现

子智能体架构：大模型决策，小模型执行

Toolin 实测评价

如何使用

作者

分类

相关文章

Gamma-World：开源多智能体世界模型

Step 3.7 Flash接入Claude Code实测指南

Syll：清华开源多模态全交互智能体框架

OpenAI 突袭发布 GPT-5.4 mini 和 nano：1/3 价格，性能逼近满血版

OpenAI 突袭发布 GPT-5.4 mini 和 nano：1/3 价格，性能逼近满血版

核心亮点：小模型也能干大事

定价：性价比拉满

工具调用与推理：博士级表现

子智能体架构：大模型决策，小模型执行

Toolin 实测评价

如何使用

作者

分类

相关文章

Gamma-World：开源多智能体世界模型

Step 3.7 Flash接入Claude Code实测指南

Syll：清华开源多模态全交互智能体框架