toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,295个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

GLM-5.2 开源实测:与 Opus 4.8、GPT 5.5 同一水平线

2026/06/18
·toolin小编

GLM-5.2 作为首个进入新御三家的中国开源模型,1M长上下文与Coding能力接近闭源旗舰水平,MIT协议可直接使用。

GLM-5.2 开源实测:与 Opus 4.8、GPT 5.5 同一水平线
GLM-5.2 开源实测:与 Opus 4.8、GPT 5.5 同一水平线
2026/06/18

GLM-5.2 开源实测:与 Opus 4.8、GPT 5.5 同一水平线

GLM-5.2 作为首个进入新御三家的中国开源模型,1M长上下文与Coding能力接近闭源旗舰水平,MIT协议可直接使用。

测试一:60个Skill体系审计测试二:世界杯夺冠推演器GLM-5.2 的具体表现三者夺冠概率预测GLM-5.2 核心特性怎么用
AI产品

GLM-5.2 是智谱 AI 发布的开源大模型,MIT 协议,在 Code Arena 排行榜上排名第一。它是首个进入 AI 编程"御三家"的中国模型。价格是 Opus 和 GPT 的零头,Coding Plan 直接能跑。我们通过两道真实任务来看看它到底什么水平。

测试一:60个Skill体系审计

测试者把攒了大半年的 60 多个自建 Skill 甩给三个模型,要求它们读取所有 Skill、画出系统架构、找出冲突和重复部分,最后生成一个 HTML 看板。

三个模型对比

指标Opus 4.8GLM-5.2Codex (GPT)
上下文峰值34.1万 / 1M22.7万 / 1M15.7万 / 25.8万
覆盖 Skill 数3464(最多)61
找出冲突9 组9 对31 对
读取策略全塞进单一上下文直读40个+子代理摘要其余分批抽取

GLM-5.2 覆盖了最多的 64 个 Skill,还挖出了一个其他两个模型都没发现的 bug。值得注意的是,Codex 受限于 258K 上下文窗口,自己承认做了取巧处理。

测试二:世界杯夺冠推演器

给三个模型同样的世界杯数据和任务:做一个夺冠推演器网站,淘汰赛对阵树 SVG 画,蒙特卡洛模拟跑一万次算夺冠概率。

世界杯推演器对比

维度Opus 4.8GLM-5.2Codex
五维总分969182
淘汰赛赛制正确 32 强正确 32 强偷懒做了 16 强
上下文峰值20.2万 / 1M7.2万 / 1M9.1万 / 258k
自我验证自开浏览器测+修2个bugNode 逻辑测试浏览器自测
设计观感暗色最精致暗色干净克制浅色

GLM-5.2 的具体表现

GLM-5.2 生成的推演器是暗色配青绿风格,干净克制。32 强赛制正确,胜者高亮带比分、败者灰掉。蒙特卡洛 0.34 秒跑完一万次。H 组四队全 1 分时,能按净胜球正确排序——tiebreaker 写对了。

它比 Opus 差在哪?没配国旗、对阵树没连接线、概率条要手动点一下才出。但它只吃了 7.2 万 token——Opus 的三分之一,同样的活最省。

三者夺冠概率预测

GPT 和 GLM-5.2 的预测比较接近(阿根廷约 25%),Opus 只给了 17%。

GLM-5.2 核心特性

  • 1M 超长上下文:与 Opus 4.8 同级的长上下文能力
  • MIT 协议开源:谁都能拿去用,不受商业限制
  • 编程能力强:可高效完成 SaaS 产品开发、项目功能添加、旧项目复活等复杂任务
  • 成本极低:价格是 Opus/GPT 的零头,Coding Plan 直接能跑

怎么用

GLM-5.2 可通过以下方式使用:

  • 智谱开放平台:直接调用 API
  • Zcode:在编程环境中使用
  • 本地部署:MIT 协议支持自行部署

原文链接:出了两道真题考 GLM-5.2,Opus 4.8 和GPT 5.5 陪跑

更多阅读:GLM 5.2 - 新"御三家"里,第一次出现中国模型!

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
测试一:60个Skill体系审计测试二:世界杯夺冠推演器GLM-5.2 的具体表现三者夺冠概率预测GLM-5.2 核心特性怎么用

相关文章

Claude Design 大更新:设计系统一键导入,代码双向同步
AI产品

Claude Design 大更新:设计系统一键导入,代码双向同步

Anthropic 推出 Claude Design 重大更新,支持设计系统导入、/design-sync 和 /design 代码双向同步及9大平台导出。

avatar for toolin小编
toolin小编
1天前
Loop Engineering 实操指南:32页橙皮书免费开源
AI教程

Loop Engineering 实操指南:32页橙皮书免费开源

《Loop Engineering橙皮书》发布,系统解析循环工程概念、五步骤工作流和六个核心零件,附Claude Code实操命令,GitHub和微信读书免费阅读。

avatar for toolin小编
toolin小编
2天前
Agnes AI 全模态API无限期免费,本周升级1M上下文与4K生图
AI产品

Agnes AI 全模态API无限期免费,本周升级1M上下文与4K生图

Agnes AI 无限期免费开放文本、图片、视频全模态模型API,本周升级1M超长上下文和4K超高清文生图能力。

avatar for toolin小编
toolin小编
1天前