PilotDeck：清华开源的智能体操作系统

如果你用过 OpenClaw 或 Codex 等 AI Agent 工具，大概率遇到过这些问题：多个项目同时跑会串记忆、Token 账单爆炸、Agent 只会被动响应不会主动干活。

PilotDeck 是清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9stars 联合研发并开源的智能体操作系统。它用 WorkSpace 隔离、白盒记忆、智能路由和 Always-on 机制，解决了当前 AI Agent 最痛的几个问题。

开源地址：https://github.com/OpenBMB/PilotDeck
官网：https://pilotdeck.openbmb.cn/

PilotDeck 是什么

一句话概括：如果 OpenClaw 是一个极客浪漫主义的「大玩具」，PilotDeck 就是面向纯粹生产力的「智能体协作舱」。

它不只是一个对话窗口，而是一个完整的项目舱——每个项目有独立的文件系统、记忆、技能和定时任务。

PilotDeck 界面

核心设计：WorkSpace 不是文件夹

PilotDeck 的核心概念是 WorkSpace，但和其他产品里的「工作区」不一样。它是一个三层结构的项目舱：

第一层：专属文件系统

每个项目有独立的可操作文件范围，AI 生成的文件自动标识。项目 A 的 Agent 不会动项目 B 的文件。

第二层：专属记忆

分两种：项目记忆（Project Memory）记录目标、进度、限制；个人记忆（Feedback Memory）记录你的偏好和具体要求。两种记忆围绕项目读写，互不干扰。

第三层：专属技能

Skill 应用商店里的工具，可以一键安装到对应的 WorkSpace。技能随任务增长自动沉淀，支持跨舱共享，也支持舱内专属。

这三层结构加在一起，Agent 不只是在帮你做事，它「活」在这个项目里。

四个关键能力

1. 白盒记忆管理

你能查看不同 WorkSpace 中的所有 Memory，包括每条记忆什么时候写入、来自哪个项目，可以追溯来源甚至修改。

还有一个叫「Dream」（做梦）的机制：让 AI 在空闲时段（通常是深夜）自动回顾、整理、优化自身的记忆与经验，类似人类睡眠时大脑整理记忆的过程。

记忆白盒化

2. 智能路由省钱

用 AI Agent 跑复杂任务通常很贵。PilotDeck 内置了智能路由：自动识别任务难度，按难度匹配模型。简单任务走价格低的子 Agent，复杂任务才调用能力强的主模型。

成本全透明，每个 WorkSpace 独立算账。实测中，一个简单项目省了 26 美元，一个复杂项目在计划阶段省了 3 美元。

3. Always-on 主动执行

多数 Agent 的工作模式还是「你问我答」。PilotDeck 的 Agent 不需要等你触发，它会主动发现值得做的事，主动确认，主动推进，主动汇报。

两种形式：Cron Job 定时任务自动执行；或让 Agent 自主发现任务。哪怕你睡觉了，Agent 也会自己判断什么值得做，搞定后主动汇报。

4. 与 GitHub 集成的持续迭代

创建项目时可以关联 GitHub 仓库，填写 Token 后 Agent 能直接推送代码。配合 Vercel 等 CI/CD 工具，每次推送都会自动重建更新网站。

实战：用 PilotDeck 开发网站

以「画家风格图鉴」项目为例，输入一段提示词，PilotDeck 会自动拆解任务、安装所需 Skill、编写代码并部署到 Vercel。

整个过程通过多轮对话迭代，可以随时让 Agent 分析项目问题、提出改进建议、拆分子任务并设置定时自动修复。吃完午饭回来，所有 Bug 都修好了，还生成了改动报告。

与其他 Agent 工具的区别

特性	PilotDeck	Codex	OpenClaw
项目隔离	三层 WorkSpace 舱	文件夹级别	无隔离
记忆管理	白盒可查可改	写入 Markdown 文件	有限上下文
成本控制	智能路由按难度分配	固定模型	固定模型
主动执行	Always-on + Cron	被动响应	被动响应
定时任务	原生支持	不支持	不支持

快速开始

# 克隆仓库
git clone https://github.com/OpenBMB/PilotDeck.git
cd PilotDeck
# 按照项目 README 配置并启动

建议先做三件事验证效果：

建两个 WorkSpace，分别跑不同风格的任务，看记忆是否隔离
同样的任务，开路由和不开路由各跑一次，对比账单
设置一个 Always-on 任务，然后去做别的事，看 Agent 能推进到什么程度