OpenAI 给 Codex 上线 Record & Replay,录下你在 Mac 上的操作流程,自动生成可复用 Skill,是时候重新思考自动化了。


OpenAI 给 Codex 上线 Record & Replay,录下你在 Mac 上的操作流程,自动生成可复用 Skill,是时候重新思考自动化了。
你坐在电脑前干活,旁边有个家伙一声不吭盯着你。你点哪它看哪,你填什么它记什么,等你做完,它说一句:下次这活我来。
这就是 OpenAI 给 Codex 上线的重磅功能 Record & Replay(录制与复现)。你把一套操作完整演示一遍,Codex 在旁边观察学习,然后把整套流程打包成一个 Skill(技能)。下回要干同样的活,新开个对话,让它调这个 Skill,告诉它这次哪里不一样,剩下的它自己搞定。
这篇文章把 Record & Replay 的适用场景、操作步骤、原理和限制一次讲清楚。
不是所有任务都适合录制。Record & Replay 瞄准的是那种重复、看个人偏好、说不清楚但做一遍你就懂的活:
这些活的共同点:要么步骤又固定又繁琐,要么里头藏着一堆只有你自己知道的隐性规则。比如文件该怎么命名、某个字段默认填啥、到了某个岔路口该往哪走。这种东西用文字一条条写清楚给 AI 成本极高——不如直接做一遍,让它自己看。
[features].computer_use 这一项是连 Record & Replay 一起管的。哪天把 computer_use 设成 false,这俩功能会一起消失在 Codex 应用里打开 Plugins(插件),搜索并添加 Record & Replay 插件。

它会请求录制权限,准备好了就点同意。

剩下的就是你在 Mac 上正常把活干一遍。这期间 Codex 全程观察,学这套操作要点哪些地方、动哪些窗口的内容。

提示:录制会一直开着,直到你主动停止。专心做那一个任务就行,别录着录着开始干别的。
从菜单栏或悬浮层停止,或者直接跟 Codex 说一声已经录完。

录完之后 Codex 会复盘一遍刚捕捉到的流程,自己起草一个 Skill。这个 Skill 里写得很清楚:
你要是觉得它写得不够好,还能让它再打磨。
提示:几条录制建议值得照做——演示尽量短而完整;录之前先把目标和那些每次会变的输入告诉 Codex;用真实输入,但密码和敏感数据千万别录进去;录完后补上重要的隐性偏好(命名规范、字段默认值、决策点怎么选);流程做完就停,别拖到无关的收尾动作上。
新开对话,让它调这个 Skill,把这次的具体值喂给它——比如要传哪个文件、建哪个 issue、报表要哪段时间。
要搞懂它凭什么能复现,得先看 Codex 到底怎么操作电脑。OpenAI 工程师 Jason 梳理过三条路径:

Computer Use(覆盖面最广):能在 macOS 和 Windows 上看见并操作图形界面,通过窗口、菜单、键盘、剪贴板来动那些授权过的应用。代价是慢——看界面、判断点哪、等响应、再确认状态,一步一回头。好处是那些没有 API 的应用它也能对付,比如 Spotify、Xcode、系统设置、iOS 模拟器,甚至能通过 iPhone 镜像操作 iPhone。Record & Replay 录下来的操作要复现,靠的就是 Computer Use 这套底层能力。
Chrome 扩展:接管你已经登录好的 Chrome,适合靠账号、cookie、已认证标签页的任务(Gmail、Salesforce、内部仪表盘)。代价是它带着你的身份在动,发送、发布、购买这种步骤一般得先过你审核。
应用内浏览器:活在 Codex 对话内部,跟你共享同一个渲染页面,特别适合开发调试 Web 应用。最大特点是隔离——不碰你的浏览器配置、cookie、扩展和登录会话。
传统 RPA 录的是动作:点哪里、填哪里、下一步去哪。而 Codex 学的是流程:这个任务什么时候触发、需要哪些输入、按什么步骤走、做完怎么验证。同一个 Skill,这次传 A 文件、下次传 B 文件,它都能套着用。
这意味着 AI 的工作对象开始从 API 扩展到整个图形界面。过去,自动化的基础是 API——软件必须先开放接口。现在 OpenAI 试图绕开这层限制:不再要求软件专门为 AI 提供接口,而是让 AI 直接学习人类使用软件的方式。
换句话说,人正在从软件的直接操作者,逐渐变成软件能力的训练者。
[features].computer_use 同时管着这两个功能
小米开源全屋智能 AI 方案 Xiaomi Miloco 2.0,多模态感知、主动智能、家庭记忆,把 Agent 带进智能家居生态。

Catnip 团队推出流式音视频社交模型 MaineCoon,22B参数实现47.5 FPS推理,支持30分钟以上音画同出,成本仅Veo 3的1/2000。

Agnes AI 无限期免费开放文本、图片、视频全模态模型API,本周升级1M超长上下文和4K超高清文生图能力。