toolin.ai logo
toolin.ai
首页
所有AI工具
AI技能包
AI教程
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具730个
技能包10个
产品功能
  • 所有AI工具
  • AI技能包
  • AI教程
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策
OpenAI 突袭发布 GPT-5.4 mini 和 nano:1/3 价格,性能逼近满血版
2026/03/18

OpenAI 突袭发布 GPT-5.4 mini 和 nano:1/3 价格,性能逼近满血版

GPT-5.4 mini 和 nano 正式上线,编码能力达满血版 94%,速度提升 2 倍,价格低至 1/12,成为 AI Agent 开发的理想引擎

OpenAI 没有预热,直接扔出了两颗炸弹:GPT-5.4 mini 和 GPT-5.4 nano。这两个轻量级模型要解决的问题很明确——在生产环境里,怎么让 AI 又快又准又便宜地干活?

GPT-5.4 mini 和 nano 发布

核心亮点:小模型也能干大事

先看最炸裂的数字:

编码能力(SWE-Bench Pro):GPT-5.4 mini 拿下 54.4%,而满血版 GPT-5.4 是 57.7%,差距仅 3.3%。这意味着一个为速度和成本优化的小模型,在解决真实工程问题时,已经摸到了旗舰模型的天花板。

计算机使用(OSWorld-Verified):GPT-5.4 mini 72.1% 的成绩,媲美 GPT-5.4(75%)。能快速解析信息密集的 UI 截图,并做出正确操作决策。

速度提升:相较于上一代 GPT-5 mini,GPT-5.4 mini 运行速度直接飙升 2 倍。

性能对比

网友直言:mini 和 nano 完全可以当做「龙虾」(AI Agent)的主力模型来用。

定价:性价比拉满

GPT-5.4 mini:

  • 输入:0.75 美元/百万 token
  • 输出:4.5 美元/百万 token
  • 上下文:400k

GPT-5.4 nano:

  • 输入:0.2 美元/百万 token
  • 输出:1.25 美元/百万 token

相较于 GPT-5.4,mini 输出价格是其 1/3,而 nano 价格只有 1/12。

定价对比

有用户试用后惊叹:速度快,还要比 Claude 4.6 Opus 便宜 9 倍。

工具调用与推理:博士级表现

在 GPQA Diamond(博士级科学推理基准)上,GPT-5.4 mini 取得了 88% 的成绩,与 GPT-5.4 仅差 5%。

在 Toolathlon(复杂工具链测试)中,GPT-5.4 mini 得分 42.9%,完全碾压 GPT-5 mini(26.9%)。这意味着它能在多步骤任务中正确地组合、排序、使用多种工具。

工具调用能力

子智能体架构:大模型决策,小模型执行

OpenAI 提出的架构思路很清晰:旗舰模型 GPT-5.4 负责规划、协调和最终决策,然后把具体任务分发给 GPT-5.4 mini 子智能体并行执行。

搜索代码库、审查大型文件、处理支持文档,这些不需要「深度思考」但需要「快速完成」的工作,全部交给 mini。而且 mini 在 Codex 中只消耗 GPT-5.4 配额的 30%。

子智能体架构

Toolin 实测评价

适合谁?

  • 需要高频调用 AI 的开发者(成本敏感)
  • 构建 AI Agent 应用的团队(速度 + 工具调用能力)
  • 需要处理编码、数据提取、分类等任务的场景

不适合谁?

  • 需要处理超长文档(64K+ 上下文)的场景:mini 在长上下文处理上与旗舰版差距明显
  • 需要最顶级推理能力的复杂任务

相比竞品的优势:

  • 比 Claude 4.6 Opus 便宜 9 倍,速度更快
  • 计算机使用能力(72.1%)远超上一代 GPT-5 mini(42%)
  • 工具调用能力大幅提升,适合 Agent 开发

明显的限制:

  • 长上下文处理是短板:在 64K-128K 窗口下,mini 只有 47.7%,而 GPT-5.4 有 86%
  • nano 在计算机使用任务上表现一般(39%),不适合需要视觉推理的场景

如何使用

API:已全面开放,支持文本和图像输入、工具使用、函数调用、网络搜索、文件搜索、计算机使用等全套能力。

ChatGPT:免费用户和 Go 用户可通过菜单中的「Thinking」功能使用。付费用户在 GPT-5.4 Thinking 额度耗尽时,mini 会自动作为降级备选方案。

Codex:支持 GPT-5.4 制定整体方案,自动调度 mini 子智能体执行各个子任务。

快、强、便宜,三个词同时成立。这在半年之前是完全不可能的。对于 AI 应用开发者来说,GPT-5.4 mini 和 nano 的发布意味着产品的推理成本可以再降一个数量级,AI 的渗透速度将进一步加快。

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
核心亮点:小模型也能干大事定价:性价比拉满工具调用与推理:博士级表现子智能体架构:大模型决策,小模型执行Toolin 实测评价如何使用

相关文章

阿里「悟空」发布:全球首个企业级AI原生工作平台,钉钉8亿用户的AI迁徙
AI产品

阿里「悟空」发布:全球首个企业级AI原生工作平台,钉钉8亿用户的AI迁徙

阿里ATH事业群发布悟空WuKong,全球首个企业智能体AI原生工作平台,支持CLI化操作、RealDoc文件系统、十大行业OPT技能套件,解决OpenClaw企业落地难题

avatar for toolin小编
toolin小编
2天前
Anthropic 内部实战:如何用 Skills 让 Claude Code 效率翻倍
AI教程

Anthropic 内部实战:如何用 Skills 让 Claude Code 效率翻倍

来自 Claude Code 团队工程师的一手经验,揭秘 Anthropic 内部几百个 Skills 的分类体系、编写技巧和分发策略

avatar for toolin小编
toolin小编
1天前
OpenAI官方实战:用Skills加速开源项目维护,PR合并量提升45%
AI教程

OpenAI官方实战:用Skills加速开源项目维护,PR合并量提升45%

OpenAI团队用Codex Skills改造Agents SDK维护流程,通过AGENTS.md、本地技能和GitHub Actions,三个月PR合并量从316增至457,提升45%

avatar for toolin小编
toolin小编
2天前