从零开始掌握 OpenAI Codex 桌面版,涵盖安装配置、界面解读、项目创建、技能与插件使用,以及手机远程控制的保姆级教程


从零开始掌握 OpenAI Codex 桌面版,涵盖安装配置、界面解读、项目创建、技能与插件使用,以及手机远程控制的保姆级教程
如果你还以为 Codex 只是程序员用来写代码的工具,那你就错过了。
Codex 本质上是一个桌面端 AI Agent(智能体)。它不只是回答问题,而是真正动手帮你干活:做网站、设计原型、处理数据、生成 PPT,甚至操控你的浏览器。目前每周有超过 500 万人在使用 Codex,其中非程序员占比已经超过 20%,而且增速是程序员的三倍。
这篇教程面向没有任何编程基础的普通用户,带你从安装到实战,完整掌握 Codex 的核心用法。预计耗时 20 分钟。
访问下载页面,选择对应系统的版本。下载完成后打开应用,可以直接用 ChatGPT 账号登录,也可以使用 OpenAI API 密钥登录。

用 ChatGPT 账号登录即可开始使用。注意,API 密钥登录方式下部分功能不可用,建议优先使用账号登录。

首次打开 Codex,界面和 ChatGPT 有些不同。核心区域分三块:

对话区底部可以设置"推理"级别,决定了 Codex 在执行任务时思考的深度:
| 档位 | 适合场景 |
|---|---|
| 低 (low) | 数据分析、起草文字、执行类编码,速度和成本优先 |
| 中 (medium) - 默认 | 写代码、做调研、处理表格和幻灯片,质量与速度均衡 |
| 高 (high) | 复杂智能体任务、深度调试、长线调研 |
| 超高 (xhigh) | 安全审查、代码审查等深度任务 |
日常使用保持"中"即可。还有一个"速度"选项可以在不降智的情况下提速 1.5 倍,但会消耗更多 token。
Codex 需要操作你的文件,因此会涉及权限问题。建议选择"替我审批"模式,兼顾效率和安全。它有以下安全红线:不会替你输系统密码、不会批准安全隐私弹窗、不会自动化终端操作。
以做一个咖啡馆网站为例,演示完整流程。
先创建一个项目文件夹,后续所有生成的文件都会保存在这里。
关键步骤:创建项目后不要直接让它干活,先打开"计划模式"。这样它会先列出完整的执行计划,等你确认后再动手。

输入你的需求描述,Codex 会逐步跟你确认细节,最终生成一份完整的需求文档。确认后选择"按方案执行"即可。
网站生成后,右上角有一个加号按钮,点击进入评论模式。鼠标移到页面元素上,点击任意位置就能直接添加修改意见。还可以用左侧的设置选项快速修改字体和颜色,改完即时预览。
提示: 左上角还有截屏按钮,一键把当前设计截图,方便分享给同事或客户。
单纯写页面不算什么,Codex 真正强大的地方在于它通过插件和技能(Skills)实现了对电脑、浏览器、办公软件的操控。
Skills 类似小龙虾(OpenClaw)的 Skills 概念,可以把重复操作封装成一个可复用的指令包。在插件区点击"技能"标签,可以看到大量预置技能。
创建自定义技能很简单:直接在对话框说"创建一个技能,用来生成 21:9 比例的公众号封面图",它会自动调用 Skill Creator 来帮你生成。使用时在聊天框输入 / 即可调出所有技能列表。
OpenAI 近期一口气发布了 6 个角色专属插件包,包含 62 个常用应用和 110 项预置技能:
| 插件包 | 核心能力 |
|---|---|
| 数据分析 | 连接 Google Drive、Gmail 等数据源,自动清洗数据、生成报表 |
| 产品设计 | 11 个预置技能,支持快速出原型、多方案对比 |
| 创意制作 | 海报、文案、视觉设计一体化 |
| 销售 | 客户管理、销售数据分析 |
| 股票投资 | 行情分析、持仓管理 |
| 投资银行 | 投研报告、财务建模 |
以产品原型设计为例:安装"产品设计"插件后,直接告诉 Codex 你要做什么产品,它会先跟你确认需求,然后一次性给出三个不同设计方向的 Demo 供你选择。
这三个功能是 Codex 从聊天工具变成真正 Agent 的关键。
安装后 Codex 能看到你的屏幕,像真人一样点鼠标、敲键盘、操作软件。适用于测试 App、修改软件设置、复现界面 Bug 等场景。每次操作前都会征求你的同意,且不能替你输密码或处理安全弹窗。
目前仅支持 macOS,欧洲、英国、瑞士暂不可用。
按下快捷键(左右两个 Command 键),Codex 就会把当前最前面的窗口截图并读取内容。看到报错界面、英文网页、任何需要 AI 帮忙的东西,一键截图直接交给它处理。

装上后 Codex 能操控 Chrome 浏览器,帮你翻网页、点按钮、填表单。注意:它操作的是你已登录的浏览器,务必盯着它的每一步操作。
在外出时也能用手机给家里的电脑派任务。手机只是"遥控器",真正干活的还是电脑端的 Codex。
设置方法:

提示: 电脑必须保持开机、联网、登录状态才能被远程控制。建议专门留一台电脑(如 Mac mini)24 小时待命。
安装完成后,建议先调整两项设置:

详解 Claude Code /workflows 功能的使用场景与实操技巧,教你用多 Agent 并行处理代码库清扫和难题调研。

MiniMax M3 是国内首个同时支持 1M 上下文、原生多模态和 Coding 的开源模型,SWE-Bench Pro 达 59%,实测表现亮眼。

OpenSquilla 推出 Meta Skill 功能,一个 Skill 内嵌多个子 Skill,能端到端打通长程工作流,还能省 60-80% 的 Token 成本