OpenAI 重构 Codex 编程工具,新增独立光标支持后台操控 macOS 应用、90 余款开发插件、心跳自动排班机制,前端可视化调试,每周 300 万开发者可用。


OpenAI 重构 Codex 编程工具,新增独立光标支持后台操控 macOS 应用、90 余款开发插件、心跳自动排班机制,前端可视化调试,每周 300 万开发者可用。
OpenAI 对 Codex 做了一次彻底重构。这个每周 300 万开发者在用的编程 Agent,现在不只是写代码了——它有了自己的鼠标光标,能后台操控 macOS 应用,能给自己排工作日程,还一口气上了 90 多个插件。如果你的工作流里包含 Xcode、CI/CD、JIRA 或 SharePoint,这次更新值得仔细看看。
这次更新最核心的能力是 Computer Use。Codex 现在有了自己的光标,和你的鼠标完全独立运作。
你在写文档,它在旁边跑 Xcode 测 App,两边同时进行。
一个完整的演示场景:你让 Codex 在 Xcode 里运行一个井字棋 App,自己玩一局测试,修复发现的 bug。Codex 会自己打开 Xcode,启动 iOS 模拟器,用自己的光标下棋。测试中发现逻辑 bug(人类走一步,电脑同时画两个 O),它会自己切回代码定位漏洞,修改后重新编译做回归验证。
运行、测试、发现 bug、修复、验证,整个闭环不到一分钟。
目前 Computer Use 仅支持 macOS,欧盟和英国用户暂不可用。Windows 端可从其他 App 拉取信息,但不支持后台光标级别操控。
Codex 客户端现在内置了浏览器,底层用的是 OpenAI 自家的 Atlas 引擎。
以前调前端 UI,你得在代码和浏览器之间来回跳。现在可以直接在渲染好的网页上操作:点击主标题留一条评论"缩小字体并缩短标语",点击左上角"加一个 Logo",在出错的地方点一下写"修复越界问题"。Codex 理解视觉和空间上下文,后台即时修改代码,页面实时刷新。

这种体验就像在审核一张设计图——你只管标注问题,底层迭代全部由 AI 搞定。目前内置浏览器仅限 localhost 本地预览,OpenAI 表示未来会扩展到完整的浏览器控制。
OpenAI 这次一口气上了 90 多个插件,覆盖了开发团队日常用到的几乎所有工具:

用法很简单,在输入框里 @ 一下插件名就行。比如 @SharePoint 让 Codex 去读产品目录下的文档生成高管简报,@CircleCI 诊断分支构建失败。
从上游需求管理到本地写代码,再到 CI/CD 和任务追踪,插件把整条开发链路串起来了。
这是本次更新中最值得关注的新机制。
Codex 现在能给自己安排未来的工作日程,到了时间自动醒过来继续干,跨天跨周都行。而且可以复用之前的对话线程,上次积累的上下文不会丢。
实际场景:让 Codex 检查 Slack、Gmail、Google 日历和 Notion,它从四个渠道抓出相关信息,给出一份按优先级排好的待办清单。你追问一句"能不能帮我一直盯着点",Codex 就会设定每小时自动巡查的日程,有需要决策的重点主动汇报。

OpenAI 内部超过 80% 的员工在用 Codex,而且不只有工程师。50% 的 Codex 用户已经在拿它做非编码任务了。OpenAI 甚至给 Claude Code 做了一个官方插件,主动把 Codex 嵌入竞品生态。目前 Codex 更强调后台执行、多 Agent 并行和无人值守,Claude Code 的优势在长上下文推理和深度代码理解。越来越多的团队选择两个都用。
一句话总结:Codex 不再只是一个编程工具,它正在变成一个不睡觉的初级员工——能看屏幕、点鼠标、管日程、串联整条工具链。如果你的日常开发涉及多个应用和工具,这次更新能显著减少上下文切换的摩擦。

阶跃开源Flash模型实测接入Claude Code,用复杂Agent工作流验证国产模型能否顶上闭源基座

阶跃星辰发布Step 3.7 Flash,400 tokens/秒推理速度,11B激活参数实现Claude Opus 4.6的97%性能,开源可本地部署

英伟达发布RTX Spark消费级AI芯片,128GB统一内存、1 PFLOP算力,可在14mm笔记本上本地运行120B大模型,Windows生态迎来AI PC时代