toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,027个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

OpenAI 突袭发布 GPT-5.4 mini 和 nano:1/3 价格,性能逼近满血版

2026/03/18
·toolin小编

GPT-5.4 mini 和 nano 正式上线,编码能力达满血版 94%,速度提升 2 倍,价格低至 1/12,成为 AI Agent 开发的理想引擎

OpenAI 突袭发布 GPT-5.4 mini 和 nano:1/3 价格,性能逼近满血版
OpenAI 突袭发布 GPT-5.4 mini 和 nano:1/3 价格,性能逼近满血版
2026/03/18

OpenAI 突袭发布 GPT-5.4 mini 和 nano:1/3 价格,性能逼近满血版

GPT-5.4 mini 和 nano 正式上线,编码能力达满血版 94%,速度提升 2 倍,价格低至 1/12,成为 AI Agent 开发的理想引擎

核心亮点:小模型也能干大事定价:性价比拉满工具调用与推理:博士级表现子智能体架构:大模型决策,小模型执行Toolin 实测评价如何使用
AI产品

OpenAI 没有预热,直接扔出了两颗炸弹:GPT-5.4 mini 和 GPT-5.4 nano。这两个轻量级模型要解决的问题很明确——在生产环境里,怎么让 AI 又快又准又便宜地干活?

GPT-5.4 mini 和 nano 发布

核心亮点:小模型也能干大事

先看最炸裂的数字:

编码能力(SWE-Bench Pro):GPT-5.4 mini 拿下 54.4%,而满血版 GPT-5.4 是 57.7%,差距仅 3.3%。这意味着一个为速度和成本优化的小模型,在解决真实工程问题时,已经摸到了旗舰模型的天花板。

计算机使用(OSWorld-Verified):GPT-5.4 mini 72.1% 的成绩,媲美 GPT-5.4(75%)。能快速解析信息密集的 UI 截图,并做出正确操作决策。

速度提升:相较于上一代 GPT-5 mini,GPT-5.4 mini 运行速度直接飙升 2 倍。

性能对比

网友直言:mini 和 nano 完全可以当做「龙虾」(AI Agent)的主力模型来用。

定价:性价比拉满

GPT-5.4 mini:

  • 输入:0.75 美元/百万 token
  • 输出:4.5 美元/百万 token
  • 上下文:400k

GPT-5.4 nano:

  • 输入:0.2 美元/百万 token
  • 输出:1.25 美元/百万 token

相较于 GPT-5.4,mini 输出价格是其 1/3,而 nano 价格只有 1/12。

定价对比

有用户试用后惊叹:速度快,还要比 Claude 4.6 Opus 便宜 9 倍。

工具调用与推理:博士级表现

在 GPQA Diamond(博士级科学推理基准)上,GPT-5.4 mini 取得了 88% 的成绩,与 GPT-5.4 仅差 5%。

在 Toolathlon(复杂工具链测试)中,GPT-5.4 mini 得分 42.9%,完全碾压 GPT-5 mini(26.9%)。这意味着它能在多步骤任务中正确地组合、排序、使用多种工具。

工具调用能力

子智能体架构:大模型决策,小模型执行

OpenAI 提出的架构思路很清晰:旗舰模型 GPT-5.4 负责规划、协调和最终决策,然后把具体任务分发给 GPT-5.4 mini 子智能体并行执行。

搜索代码库、审查大型文件、处理支持文档,这些不需要「深度思考」但需要「快速完成」的工作,全部交给 mini。而且 mini 在 Codex 中只消耗 GPT-5.4 配额的 30%。

子智能体架构

Toolin 实测评价

适合谁?

  • 需要高频调用 AI 的开发者(成本敏感)
  • 构建 AI Agent 应用的团队(速度 + 工具调用能力)
  • 需要处理编码、数据提取、分类等任务的场景

不适合谁?

  • 需要处理超长文档(64K+ 上下文)的场景:mini 在长上下文处理上与旗舰版差距明显
  • 需要最顶级推理能力的复杂任务

相比竞品的优势:

  • 比 Claude 4.6 Opus 便宜 9 倍,速度更快
  • 计算机使用能力(72.1%)远超上一代 GPT-5 mini(42%)
  • 工具调用能力大幅提升,适合 Agent 开发

明显的限制:

  • 长上下文处理是短板:在 64K-128K 窗口下,mini 只有 47.7%,而 GPT-5.4 有 86%
  • nano 在计算机使用任务上表现一般(39%),不适合需要视觉推理的场景

如何使用

API:已全面开放,支持文本和图像输入、工具使用、函数调用、网络搜索、文件搜索、计算机使用等全套能力。

ChatGPT:免费用户和 Go 用户可通过菜单中的「Thinking」功能使用。付费用户在 GPT-5.4 Thinking 额度耗尽时,mini 会自动作为降级备选方案。

Codex:支持 GPT-5.4 制定整体方案,自动调度 mini 子智能体执行各个子任务。

快、强、便宜,三个词同时成立。这在半年之前是完全不可能的。对于 AI 应用开发者来说,GPT-5.4 mini 和 nano 的发布意味着产品的推理成本可以再降一个数量级,AI 的渗透速度将进一步加快。

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
核心亮点:小模型也能干大事定价:性价比拉满工具调用与推理:博士级表现子智能体架构:大模型决策,小模型执行Toolin 实测评价如何使用

相关文章

SenseNova U1:开源的多模态图文创作模型
AI产品

SenseNova U1:开源的多模态图文创作模型

商汤发布 SenseNova U1 系列多模态模型,原生统一架构实现连续图文创作,免费开源,可作为 GPT Image 2 的国产替代方案

avatar for toolin小编
toolin小编
2天前
一下午用 Codex 从零开发完整游戏
AI教程

一下午用 Codex 从零开发完整游戏

用 OpenAI Codex 一句话启动游戏开发,自动生成素材、抠图、配乐,一个下午做出可发布的完整游戏

avatar for toolin小编
toolin小编
18小时前
DeepSeek 发布视觉原语技术:让AI学会边指边想
AI产品

DeepSeek 发布视觉原语技术:让AI学会边指边想

DeepSeek 公布多模态推理新技术 Thinking with Visual Primitives,用坐标替代语言描述,在多项视觉推理任务上超越 GPT-5.4 和 Claude Sonnet 4.6

avatar for toolin小编
toolin小编
2天前