
Cursor 发布自研 AI 模型 Composer 2,通过自我总结强化学习实现性能突破,在多项基准测试中超越 Claude Opus 4.6
Cursor 刚刚发布了自研 AI 模型 Composer 2,这是一个专门为代码生成优化的模型。最引人注目的是:它在多项基准测试中的表现已经超越了 Claude Opus 4.6。
Composer 2 的训练方法很有意思——它会在生成代码后,自己总结"我刚才做了什么",然后用这些总结来优化下一次的输出。这种 self-summarization reinforcement learning 的方法让模型在处理复杂编程任务时更加连贯。
传统的代码生成模型往往是"一次性输出",而 Composer 2 更像是一个会反思的程序员:写完代码后会回顾思路,下次遇到类似问题时就能做得更好。
根据 Cursor 官方公布的数据:
这些数字意味着什么?简单来说,如果你让 Composer 2 修复一个 GitHub issue,它成功的概率比之前的顶级模型更高。
我们用 Composer 2 测试了几个典型场景:
优势明显的场景:
仍需改进的地方:
如果你是 Cursor 的重度用户,并且经常处理复杂的多文件编辑任务,Composer 2 值得一试。但如果你只是偶尔写写脚本,或者主要用 VS Code + Copilot,暂时没必要切换。
对于团队来说,这个模型的"自我总结"特性在协作场景下可能更有价值——它生成的代码往往带有更清晰的注释和逻辑说明。
相关链接:

手把手教你使用开源的 AI 漫剧平台,从剧本生成、角色固定到分镜绘制,一站式制作高质量漫画。
阿里ATH事业群发布悟空WuKong,全球首个企业智能体AI原生工作平台,支持CLI化操作、RealDoc文件系统、十大行业OPT技能套件,解决OpenClaw企业落地难题

Code Pilot 复刻 Claude 生成式 UI 交互,支持流式输出交互式图表、小工具和架构图,兼容 Kimi K2.5 等国产模型