toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,146个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

GLM-5.1 高速版实测:400 TPS 不掉智商

2026/05/23
·toolin小编

智谱 GLM-5.1 高速版 API 内测实测 TPS 达 350-400 tokens/s,采用 TileRT 推理引擎,在 Claude Code 中配合使用体验极佳,目前仅面向企业客户开放。

GLM-5.1 高速版实测:400 TPS 不掉智商
GLM-5.1 高速版实测:400 TPS 不掉智商
2026/05/23

GLM-5.1 高速版实测:400 TPS 不掉智商

智谱 GLM-5.1 高速版 API 内测实测 TPS 达 350-400 tokens/s,采用 TileRT 推理引擎,在 Claude Code 中配合使用体验极佳,目前仅面向企业客户开放。

GLM-5.1 高速版是什么实测对比数据实际使用案例Text-to-World 3D Demo宠物电商网站在 Claude Code 中配置使用应用场景不足与限制价格
AI产品

如果你用 AI Coding 工具写代码,最让人崩溃的事之一就是等。让它改个组件转圈十几秒,重构个模块一分钟还在吐字。智谱最新推出的 GLM-5.1 高速版,实测 TPS 达到 350-400 tokens/s,代码几乎是"喷"出来的,而且生成质量没有缩水。

GLM-5.1 高速版是什么

GLM-5.1 高速版是智谱基于自研 TileRT 推理引擎推出的高速 API 版本。核心思路是把传统推理框架里零碎的算子调度、内存读写、同步等待全部干掉,编译期就把整个计算图编排成一个常驻 GPU 的 Engine Kernel。

简单说:传统方案每算一步都要"汇报一次",TileRT 直接把整条流水线焊死在 GPU 上,中间不回头,一路算到底。所以 400 tokens/s 不是峰值跑分,是稳定可用的生产级速度。

实测对比数据

在 Claude Code 中分别配置不同模型,执行相同任务后的对比数据:

模型TPS (tokens/s)实际耗时备注
GLM-5.1 高速版300-3502.6 秒生成质量与标准版一致
GPT 5.5 high (Codex)153.1约 47 秒与第三方基准测试吻合
DeepSeek V4 Pro55.0约 2.3 分钟成本低但速度差距明显

TPS 详细数据面板

实际使用案例

Text-to-World 3D Demo

用一段提示词让模型从零实现一个"自然语言控制 3D 世界"的 Web 应用,GLM-5.1 高速版在 30 秒内完成,包含 React + TypeScript + React Three Fiber 的完整项目代码。

宠物电商网站

从零开发一个功能完全可用的宠物电商网站,GLM-5.1 高速版耗时 1.4 分钟(TPS 约 300),同样任务用 DeepSeek V4 Pro 花了 4.1 分钟。

宠物电商网站开发数据对比

在 Claude Code 中配置使用

GLM-5.1 高速版可以通过 API 接入 Claude Code、Hermes Agent、OpenClaw 等 AI Coding 工具。在 Claude Code 中替换模型后,所有代码生成任务的响应速度会显著提升,体感上"你还没反应过来它就干完了"。

应用场景

  • 高频 AI Coding:接进 Claude Code 等工具后,代码生成速度从"等"变成"实时响应"
  • 快速原型开发:几分钟内完成完整项目,适合 MVP 验证
  • 批量代码任务:大规模重构、迁移等需要反复生成代码的场景

不足与限制

  • 目前 GLM-5.1-HighSpeed 仅面向部分企业客户定向开放,个人开发者暂无法使用
  • 实测 TPS 在 300-350 之间,与官方标称的 400 有一定差距
  • 生成效果与标准版 GLM-5.1 基本一致,但在复杂推理场景下是否完全等价还需更多验证

价格

目前为内测阶段,仅面向企业客户定向开放,具体定价尚未公布。

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
GLM-5.1 高速版是什么实测对比数据实际使用案例Text-to-World 3D Demo宠物电商网站在 Claude Code 中配置使用应用场景不足与限制价格

相关文章

ECC: Claude Code的38智能体开源配置系统
AI产品

ECC: Claude Code的38智能体开源配置系统

GitHub 15万星的Claude Code配置神器,内置38个专业智能体、156项技能、1282项安全测试,MIT协议完全开源

avatar for toolin小编
toolin小编
7小时前
CODA:让LLM和新手写出光速GPU内核
AI产品

CODA:让LLM和新手写出光速GPU内核

来自MIT和普林斯顿的开源项目,把Transformer训练中的散碎计算重写为GEMM-Epilogue模式,反向传播加速1.6-1.8倍

avatar for toolin小编
toolin小编
7小时前
Codex 进阶玩法:让 AI Agent 替你全天候工作
AI教程

Codex 进阶玩法:让 AI Agent 替你全天候工作

OpenAI Codex 团队成员公开完整工作流,涵盖长期线程管理、Heartbeats 定时任务、Goal 模式和本地知识库搭建,帮你把 Codex 从工具变成全职 AI 员工。

avatar for toolin小编
toolin小编
2天前