Cursor 发布自研 AI 模型 Composer 2,通过自我总结强化学习实现性能突破,在多项基准测试中超越 Claude Opus 4.6


Cursor 发布自研 AI 模型 Composer 2,通过自我总结强化学习实现性能突破,在多项基准测试中超越 Claude Opus 4.6
Cursor 刚刚发布了自研 AI 模型 Composer 2,这是一个专门为代码生成优化的模型。最引人注目的是:它在多项基准测试中的表现已经超越了 Claude Opus 4.6。
Composer 2 的训练方法很有意思——它会在生成代码后,自己总结"我刚才做了什么",然后用这些总结来优化下一次的输出。这种 self-summarization reinforcement learning 的方法让模型在处理复杂编程任务时更加连贯。
传统的代码生成模型往往是"一次性输出",而 Composer 2 更像是一个会反思的程序员:写完代码后会回顾思路,下次遇到类似问题时就能做得更好。
根据 Cursor 官方公布的数据:
这些数字意味着什么?简单来说,如果你让 Composer 2 修复一个 GitHub issue,它成功的概率比之前的顶级模型更高。
我们用 Composer 2 测试了几个典型场景:
优势明显的场景:
仍需改进的地方:
如果你是 Cursor 的重度用户,并且经常处理复杂的多文件编辑任务,Composer 2 值得一试。但如果你只是偶尔写写脚本,或者主要用 VS Code + Copilot,暂时没必要切换。
对于团队来说,这个模型的"自我总结"特性在协作场景下可能更有价值——它生成的代码往往带有更清晰的注释和逻辑说明。
相关链接:

豆包 Seed 2.0 Lite 升级为全模态理解模型,同时支持图片、视频、音频、文本四种输入,实测前端动效复刻、视频内容理解、对话情绪识别等场景。

同样一个提示词丢给不同AI生图模型,出来的风格天差地别。本文对比Image-2、Nano Banana 2、豆包/即梦、可灵的视觉特点,帮你快速选对模型。

GPT-5.5驱动Codex实现全自动编程,50个并行Codex同时运行,全平台产品矩阵覆盖Mac、iOS和浏览器