Cursor 发布自研 AI 模型 Composer 2,通过自我总结强化学习实现性能突破,在多项基准测试中超越 Claude Opus 4.6


Cursor 发布自研 AI 模型 Composer 2,通过自我总结强化学习实现性能突破,在多项基准测试中超越 Claude Opus 4.6
Cursor 刚刚发布了自研 AI 模型 Composer 2,这是一个专门为代码生成优化的模型。最引人注目的是:它在多项基准测试中的表现已经超越了 Claude Opus 4.6。
Composer 2 的训练方法很有意思——它会在生成代码后,自己总结"我刚才做了什么",然后用这些总结来优化下一次的输出。这种 self-summarization reinforcement learning 的方法让模型在处理复杂编程任务时更加连贯。
传统的代码生成模型往往是"一次性输出",而 Composer 2 更像是一个会反思的程序员:写完代码后会回顾思路,下次遇到类似问题时就能做得更好。
根据 Cursor 官方公布的数据:
这些数字意味着什么?简单来说,如果你让 Composer 2 修复一个 GitHub issue,它成功的概率比之前的顶级模型更高。
我们用 Composer 2 测试了几个典型场景:
优势明显的场景:
仍需改进的地方:
如果你是 Cursor 的重度用户,并且经常处理复杂的多文件编辑任务,Composer 2 值得一试。但如果你只是偶尔写写脚本,或者主要用 VS Code + Copilot,暂时没必要切换。
对于团队来说,这个模型的"自我总结"特性在协作场景下可能更有价值——它生成的代码往往带有更清晰的注释和逻辑说明。
相关链接:

小米开源全屋智能 AI 方案 Xiaomi Miloco 2.0,多模态感知、主动智能、家庭记忆,把 Agent 带进智能家居生态。

Codex 推出储蓄重置功能,付费用户获一次额度重置机会,限时邀请活动中双方各得一次,灵活管理编程算力。

Catnip 团队推出流式音视频社交模型 MaineCoon,22B参数实现47.5 FPS推理,支持30分钟以上音画同出,成本仅Veo 3的1/2000。