xAI发布Grok 4.3,API价格大幅下降40-60%,代理任务Elo提升321分,但硬推理仍落后GPT-5.5和Claude 4.7。


xAI发布Grok 4.3,API价格大幅下降40-60%,代理任务Elo提升321分,但硬推理仍落后GPT-5.5和Claude 4.7。
xAI 发布 Grok 4.3,马斯克甚至没单独发推,看起来只是个过渡版本。但仔细看数据:API 价格降了 40-60%,代理任务 Elo 提升了 321 分,输出速度约 196 Tokens/s。这是一次务实的产品换挡。
Artificial Analysis 给 Grok 4.3 的 Intelligence Index 打到 53 分,比 Grok 4.20 提升了 4 分,超过了 Claude Sonnet 4.6 和 Muse Spark。

Grok 4.3 Intelligence Index 53 分,在 xAI 模型线里是最强一档
更值得关注的是代理任务表现。Grok 4.3 在 GDPval-AA 上拿到 1500 Elo,相比上一代的 1179 提升了 321 分。这个榜单更接近日常"让 AI 做事"的场景——整理资料、执行复杂步骤、处理真实工作流。

代理任务 Elo 大幅提升,更擅长处理实际工作流
Grok 4.3 可以创建演示文稿、文档和电子表格,能在计算机环境里写代码、运行代码、安装依赖并产出文件。对不懂代码的用户来说,很多原本需要在 Excel、PowerPoint、浏览器之间来回切换的操作,可能被压缩成一句指令。
Grok 4.3 的 API 定价很有侵略性:
| 项目 | Grok 4.3 | Grok 4.20 | 降幅 |
|---|---|---|---|
| 输入价格(每百万 Tokens) | $1.25 | ~$2.08 | 约 40% |
| 输出价格(每百万 Tokens) | $2.50 | ~$6.25 | 约 60% |
Artificial Analysis 测算,运行整套 Intelligence Index 评测成本约 $395,比 Grok 4.20 低约 20%。

Grok 4.3 API 价格对比上一代大幅下降
Grok 4.3 是 xAI 当前输出速度最快的模型之一,约 196 Tokens/s,属于很快的水平。
Grok 4.3 在性价比和实用性上进步明显,但仍有明显天花板:
适合 Grok 4.3 的场景:
不适合的场景:

华为支持的openJiuwen社区开源JiuwenSwarm,提供多Agent协同、技能沉淀、自演进的全栈框架,支持医疗、教育、内容创作等多场景。

微信读书官方 AI skill 开放 6 项数据查询能力,开源增强版 huashu-weread 通过书架与笔记交叉分析提供个性化推荐和阅读主题演化追踪。

Anthropic 一口气发布 10 个金融智能体模板、Office 全家桶集成和 tool_search 按需调用机制,Claude 正从聊天框变成 AI 工作操作系统。