PilotDeck 是清华大学 THUNLP 实验室等团队联合开源的 Agent 操作系统,支持 WorkSpace 独立隔离、白盒记忆管理、智能路由省钱和 Always-on 主动执行。


PilotDeck 是清华大学 THUNLP 实验室等团队联合开源的 Agent 操作系统,支持 WorkSpace 独立隔离、白盒记忆管理、智能路由省钱和 Always-on 主动执行。
如果你用过 OpenClaw 或 Codex 等 AI Agent 工具,大概率遇到过这些问题:多个项目同时跑会串记忆、Token 账单爆炸、Agent 只会被动响应不会主动干活。
PilotDeck 是清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9stars 联合研发并开源的智能体操作系统。它用 WorkSpace 隔离、白盒记忆、智能路由和 Always-on 机制,解决了当前 AI Agent 最痛的几个问题。
一句话概括:如果 OpenClaw 是一个极客浪漫主义的「大玩具」,PilotDeck 就是面向纯粹生产力的「智能体协作舱」。
它不只是一个对话窗口,而是一个完整的项目舱——每个项目有独立的文件系统、记忆、技能和定时任务。

PilotDeck 的核心概念是 WorkSpace,但和其他产品里的「工作区」不一样。它是一个三层结构的项目舱:
第一层:专属文件系统
每个项目有独立的可操作文件范围,AI 生成的文件自动标识。项目 A 的 Agent 不会动项目 B 的文件。
第二层:专属记忆
分两种:项目记忆(Project Memory)记录目标、进度、限制;个人记忆(Feedback Memory)记录你的偏好和具体要求。两种记忆围绕项目读写,互不干扰。
第三层:专属技能
Skill 应用商店里的工具,可以一键安装到对应的 WorkSpace。技能随任务增长自动沉淀,支持跨舱共享,也支持舱内专属。
这三层结构加在一起,Agent 不只是在帮你做事,它「活」在这个项目里。
你能查看不同 WorkSpace 中的所有 Memory,包括每条记忆什么时候写入、来自哪个项目,可以追溯来源甚至修改。
还有一个叫「Dream」(做梦)的机制:让 AI 在空闲时段(通常是深夜)自动回顾、整理、优化自身的记忆与经验,类似人类睡眠时大脑整理记忆的过程。

用 AI Agent 跑复杂任务通常很贵。PilotDeck 内置了智能路由:自动识别任务难度,按难度匹配模型。简单任务走价格低的子 Agent,复杂任务才调用能力强的主模型。
成本全透明,每个 WorkSpace 独立算账。实测中,一个简单项目省了 26 美元,一个复杂项目在计划阶段省了 3 美元。
多数 Agent 的工作模式还是「你问我答」。PilotDeck 的 Agent 不需要等你触发,它会主动发现值得做的事,主动确认,主动推进,主动汇报。
两种形式:Cron Job 定时任务自动执行;或让 Agent 自主发现任务。哪怕你睡觉了,Agent 也会自己判断什么值得做,搞定后主动汇报。
创建项目时可以关联 GitHub 仓库,填写 Token 后 Agent 能直接推送代码。配合 Vercel 等 CI/CD 工具,每次推送都会自动重建更新网站。
以「画家风格图鉴」项目为例,输入一段提示词,PilotDeck 会自动拆解任务、安装所需 Skill、编写代码并部署到 Vercel。
整个过程通过多轮对话迭代,可以随时让 Agent 分析项目问题、提出改进建议、拆分子任务并设置定时自动修复。吃完午饭回来,所有 Bug 都修好了,还生成了改动报告。
| 特性 | PilotDeck | Codex | OpenClaw |
|---|---|---|---|
| 项目隔离 | 三层 WorkSpace 舱 | 文件夹级别 | 无隔离 |
| 记忆管理 | 白盒可查可改 | 写入 Markdown 文件 | 有限上下文 |
| 成本控制 | 智能路由按难度分配 | 固定模型 | 固定模型 |
| 主动执行 | Always-on + Cron | 被动响应 | 被动响应 |
| 定时任务 | 原生支持 | 不支持 | 不支持 |
# 克隆仓库
git clone https://github.com/OpenBMB/PilotDeck.git
cd PilotDeck
# 按照项目 README 配置并启动建议先做三件事验证效果: