智谱GLM-5.2支持100万token上下文,下周MIT协议开源,实测完成85页世界杯前瞻PPT,多agent并行处理效率超预期


智谱GLM-5.2支持100万token上下文,下周MIT协议开源,实测完成85页世界杯前瞻PPT,多agent并行处理效率超预期
GLM-5.2 是智谱最新发布的大语言模型,支持 100 万 token 上下文窗口,采用 MIT 协议开源。它在 Claude Code 框架中展现了出色的长上下文处理能力、多 agent 并行调度能力和自主事实核查能力。本文通过一个 85 页世界杯前瞻 PPT 的实战项目,带你了解 GLM-5.2 在复杂工程中的真实表现。
GLM-5.2 的关键参数:
任务目标是将 2026 世界杯全部小组赛做成一整套前瞻 PPT,要求:
最终产出:1 张封面 + 12 个小组前瞻 + 72 场比赛 = 85 页。
GLM-5.2 在任务初期就遇到了一个典型陷阱:往届世界杯是 32 队 48 场小组赛,而 2026 世界杯已改制成 48 队 12 组,实际是 72 场。
它没有顺着错误数字往下做,而是主动停下来,交叉核对 FIFA 官网、ESPN 等多个源,确认了 72 场的正确数字。
这个"知道自己可能记错"的能力,是判断模型智力水平的关键指标。
面对 85 页的体量,GLM-5.2 没有逐页顺序处理,而是自动设计了一套五层流水线:
关键设计决策:子 agent 只产出结构化内容,不直接写 HTML。这样 85 页的风格才能锁死成一套。
整套 85 页在约一小时内全部落地,提供了两套风格供选择:
72 场比赛体量下风格保持统一,信息层次清晰,核心要点、预测和数据一应俱全。

信息层次清晰,72场体量下风格保持统一。
GLM-5.2 作为纯文本模型,通过调用视觉模型进行多模态校验,自主检查页面溢出和裁切问题。

除了世界杯项目,GLM-5.2 还通过了多项工程能力测试:
动态月相时钟:约 925 行纯前端代码,零外部依赖完成五层同心 SVG、七颗齿轮、60 分钟刻度、椭圆星轨、月相盘。发现 bug 后主动推倒重写,不堆技术债。
3D 点球大战:使用 Three.js + Cannon.js,包含五轮攻防、三档 AI 难度、马格努斯弧线物理效果。甚至会查阅论文获取真实门将扑救生物力学参数。
迷你 Excel:花一小时在纯浏览器环境中复刻 Excel 桌面端核心体验,包含公式引擎、30+ 函数、60 步撤销重做。

GLM-5.2发现月相bug后主动推倒重写,用双弧path替代mask方案。

所有引用的数据源均经过验证,无虚构内容。
如果你有大型项目需要完成,GLM-5.2 + Claude Code 框架是相当不错的选择。在实际使用中,原生 Claude Code 和接了 GLM-5.2 的 Claude Code 在输出质量和交互体验上已经很难区分。

通过泄露的Fable 5系统级Prompt和--system-prompt-file参数,在Opus 4.8上注入Fable 5的'人格底稿',实现相近的输出效果

上海AI实验室开源的轻量级 Agent 安全工具,用三维诊断分析执行轨迹风险,支持在线护栏部署

从部署 Agent 到自动竞标任务,完整拆解 AI Agent 在 ClawHunt 平台上接活赚钱的全流程