Deep Researcher Agent：每天5毛钱，让AI替你跑深度学习实验

做深度学习研究的人，大概都经历过这种循环：改超参 -> 跑训练 -> 等6小时 -> 看结果 -> 再改 -> 再跑。最让人崩溃的不是辛苦，是这件事本质上全是机械操作。Deep Researcher Agent 这个开源框架就是为了解决这个问题而生的——你睡觉的时候，它在炼丹；你写论文的时候，它已经把结果表准备好了。

Deep Researcher Agent 是什么

它是一个开源的深度学习实验自动化框架，核心功能是让 AI Agent 按照 THINK -> EXECUTE -> MONITOR -> REFLECT 的循环，7x24 小时不间断地替你跑实验。不依赖 LLM API 做监控（训练期间零 API 开销），一天成本只要五毛钱。

Deep Researcher Agent 框架概览

项目地址：https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7

核心工作流程

框架的核心是一个自主循环，分为四个阶段：

自主循环流程

THINK（想方案）

Agent 读取项目说明和历史实验记忆，分析当前最优结果，决定下一步该试什么。它不只是改超参，还能改模型代码、换 loss 函数、加数据增强策略。

EXECUTE（写代码 + 起任务）

Agent 自动改代码或配置，先跑一个强制 dry-run（2 步前向反向）确认没有 bug，然后才把真正的训练提交到 GPU 上。

MONITOR（零成本监控）

这是整个项目最关键的设计：训练期间，Agent 完全不调用 LLM API。它只做三件事：

kill -0 $PID -- 检查进程是否存活
nvidia-smi -- 检查 GPU 是否在工作
tail -- 查看日志最后几行

这三个操作的 API 成本是零。

REFLECT（分析结果）

训练结束后，Agent 解析日志、提取指标、与历史最优对比、记录里程碑，然后开启下一轮循环。

一天五毛钱的成本逻辑

24/7 跑 LLM Agent，为什么这么便宜？

关键就在「零成本 MONITOR」。一天 24 小时里，90% 以上的时间都在训练，这段时间 LLM 调用费为零。只有开头的「想方案」和结尾的「看结果」才需要调用大模型，每次几分钟。

成本计算

恒定记忆：跑半年内存不涨

长时间运行的 Agent 有个经典问题：上下文越积越长，又慢又贵又蠢。Deep Researcher Agent 的解法是一个两层记忆系统：

第一层：人类写的项目说明（冻结不变，最大 3000 字符）
第二层：Agent 自己维护的滚动日志，关键成果自动压缩到 1200 字符以内，最近决策只保留 15 条

总记忆量恒定在约 5000 字符。跑 1 天是这个数，跑 6 个月还是这个数。

实际使用效果

这个框架已经在多个真实研究项目中连续跑了 30 多天：

自主完成 500+ 轮实验循环
单个项目指标比 baseline 提升 52%
同时管理 4 个项目、4 台 GPU 服务器
最长连续运行 30+ 天，人类只介入了五六次

支持的模型

框架不绑定单一 LLM，config 改一行就能切换：

Anthropic 系：Claude Sonnet 4.6（快）/ Claude Opus 4.6（最强）
OpenAI 系：Codex 5.3（快）/ GPT 5.4（最强）

快速开始

安装只需要两步：

git clone https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7.git
cd auto-deep-researcher-24x7
python install.py

安装完成后，你会获得 7 个 Claude Code / Codex 斜杠命令，可以直接用来管理实验循环。

安装后的斜杠命令

如果你完全不会用，仓库里有个 AI_GUIDE.md 文件，把它直接丢给任何 AI 助手，它会交互式地一步步带你装好、跑起第一个实验。

手机端监控

配合 Happy Coder App（iOS / Android），你可以在手机上：

实时查看实验进度
接收训练完成 / 出 bug 推送
随时给 Agent 下达「换个方向」的指令

端到端加密，代码和结果完全私密。

手机端监控界面

适用人群

如果你是深度学习研究者，经常需要在 deadline 前反复调参跑实验，Deep Researcher Agent 能帮你把机械性的操作环节全部自动化。你只需要提供 idea 和判断，跑实验的事交给它。

参考链接

GitHub 项目地址：https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7

kill -0 $PID -- 检查进程是否存活
nvidia-smi -- 检查 GPU 是否在工作
tail -- 查看日志最后几行

这三个操作的 API 成本是零。

第一层：人类写的项目说明（冻结不变，最大 3000 字符）
第二层：Agent 自己维护的滚动日志，关键成果自动压缩到 1200 字符以内，最近决策只保留 15 条

总记忆量恒定在约 5000 字符。跑 1 天是这个数，跑 6 个月还是这个数。

实际使用效果

这个框架已经在多个真实研究项目中连续跑了 30 多天：

自主完成 500+ 轮实验循环
单个项目指标比 baseline 提升 52%
同时管理 4 个项目、4 台 GPU 服务器
最长连续运行 30+ 天，人类只介入了五六次

支持的模型

框架不绑定单一 LLM，config 改一行就能切换：

Anthropic 系：Claude Sonnet 4.6（快）/ Claude Opus 4.6（最强）
OpenAI 系：Codex 5.3（快）/ GPT 5.4（最强）

快速开始

安装只需要两步：

git clone https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7.git
cd auto-deep-researcher-24x7
python install.py

安装完成后，你会获得 7 个 Claude Code / Codex 斜杠命令，可以直接用来管理实验循环。

安装后的斜杠命令

如果你完全不会用，仓库里有个 AI_GUIDE.md 文件，把它直接丢给任何 AI 助手，它会交互式地一步步带你装好、跑起第一个实验。

手机端监控

配合 Happy Coder App（iOS / Android），你可以在手机上：

实时查看实验进度
接收训练完成 / 出 bug 推送
随时给 Agent 下达「换个方向」的指令

端到端加密，代码和结果完全私密。

手机端监控界面

适用人群

参考链接

GitHub 项目地址：https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7

全部

AI教程

AI产品

AI资源

Deep Researcher Agent：每天5毛钱，让AI替你跑深度学习实验

Deep Researcher Agent：每天5毛钱，让AI替你跑深度学习实验

作者

分类

相关文章

ShotStream：实时导演多镜头长视频的开源框架（ECCV 2026）

像聊天一样做CAD建模：浙大开源 CADDesigner 实操指南

歌歌AI（GoGo）：国内首个纯中文 AI 音乐模型实操解析

Deep Researcher Agent：每天5毛钱，让AI替你跑深度学习实验

Deep Researcher Agent：每天5毛钱，让AI替你跑深度学习实验

作者

分类

相关文章

ShotStream：实时导演多镜头长视频的开源框架（ECCV 2026）

像聊天一样做CAD建模：浙大开源 CADDesigner 实操指南

歌歌AI（GoGo）：国内首个纯中文 AI 音乐模型实操解析