Grok 4.3评测：更便宜更快的务实升级

xAI 发布 Grok 4.3，马斯克甚至没单独发推，看起来只是个过渡版本。但仔细看数据：API 价格降了 40-60%，代理任务 Elo 提升了 321 分，输出速度约 196 Tokens/s。这是一次务实的产品换挡。

Grok 4.3 变强了吗

Artificial Analysis 给 Grok 4.3 的 Intelligence Index 打到 53 分，比 Grok 4.20 提升了 4 分，超过了 Claude Sonnet 4.6 和 Muse Spark。

Grok 4.3 Intelligence Index 53 分，在 xAI 模型线里是最强一档

更值得关注的是代理任务表现。Grok 4.3 在 GDPval-AA 上拿到 1500 Elo，相比上一代的 1179 提升了 321 分。这个榜单更接近日常"让 AI 做事"的场景——整理资料、执行复杂步骤、处理真实工作流。

代理任务 Elo 大幅提升，更擅长处理实际工作流

实用功能

Grok 4.3 可以创建演示文稿、文档和电子表格，能在计算机环境里写代码、运行代码、安装依赖并产出文件。对不懂代码的用户来说，很多原本需要在 Excel、PowerPoint、浏览器之间来回切换的操作，可能被压缩成一句指令。

价格大幅下降

Grok 4.3 的 API 定价很有侵略性：

项目	Grok 4.3	Grok 4.20	降幅
输入价格（每百万 Tokens）	$1.25	~$2.08	约 40%
输出价格（每百万 Tokens）	$2.50	~$6.25	约 60%

Artificial Analysis 测算，运行整套 Intelligence Index 评测成本约 $395，比 Grok 4.20 低约 20%。

Grok 4.3 API 价格对比上一代大幅下降

速度表现

Grok 4.3 是 xAI 当前输出速度最快的模型之一，约 196 Tokens/s，属于很快的水平。

与竞品的差距

Grok 4.3 在性价比和实用性上进步明显，但仍有明显天花板：

硬推理能力仍落后于 GPT-5.5 和 Claude Opus 4.7
稳定性和可信度上仍有差距
更适合"性价比优先"场景，不适合需要深度推理的任务

适合 Grok 4.3 的场景：

日常办公辅助：写周报、搭表格、做方案、拆会议纪要、生成 PPT
成本敏感的 API 调用场景
需要快速输出的批量处理任务

不适合的场景：

复杂数学推理和代码竞赛
需要高可信度的知识密集型问答
对输出一致性要求极高的生产环境

Grok 4.3 变强了吗

Artificial Analysis 给 Grok 4.3 的 Intelligence Index 打到 53 分，比 Grok 4.20 提升了 4 分，超过了 Claude Sonnet 4.6 和 Muse Spark。

Grok 4.3 Intelligence Index 53 分，在 xAI 模型线里是最强一档

代理任务 Elo 大幅提升，更擅长处理实际工作流

实用功能

价格大幅下降

Grok 4.3 的 API 定价很有侵略性：

项目	Grok 4.3	Grok 4.20	降幅
输入价格（每百万 Tokens）	$1.25	~$2.08	约 40%
输出价格（每百万 Tokens）	$2.50	~$6.25	约 60%

Artificial Analysis 测算，运行整套 Intelligence Index 评测成本约 $395，比 Grok 4.20 低约 20%。

Grok 4.3 API 价格对比上一代大幅下降

速度表现

Grok 4.3 是 xAI 当前输出速度最快的模型之一，约 196 Tokens/s，属于很快的水平。

与竞品的差距

Grok 4.3 在性价比和实用性上进步明显，但仍有明显天花板：

硬推理能力仍落后于 GPT-5.5 和 Claude Opus 4.7
稳定性和可信度上仍有差距
更适合"性价比优先"场景，不适合需要深度推理的任务

适合 Grok 4.3 的场景：

日常办公辅助：写周报、搭表格、做方案、拆会议纪要、生成 PPT
成本敏感的 API 调用场景
需要快速输出的批量处理任务

不适合的场景：

复杂数学推理和代码竞赛
需要高可信度的知识密集型问答
对输出一致性要求极高的生产环境

全部

AI教程

AI产品

AI资源

Grok 4.3评测：更便宜更快的务实升级

Grok 4.3评测：更便宜更快的务实升级

Grok 4.3 变强了吗

实用功能

价格大幅下降

速度表现

与竞品的差距

作者

分类

相关文章

DeepSeek Deep Code：Claude Code 的国产终端替代

Codex 开源模式：一行配置接入本地模型

MaineCoon：史上最快流式音视频社交模型

Grok 4.3评测：更便宜更快的务实升级

Grok 4.3评测：更便宜更快的务实升级

Grok 4.3 变强了吗

实用功能

价格大幅下降

速度表现

与竞品的差距

作者

分类

相关文章

DeepSeek Deep Code：Claude Code 的国产终端替代

Codex 开源模式：一行配置接入本地模型

MaineCoon：史上最快流式音视频社交模型