开源框架Deep Researcher Agent通过自主循环实现7x24小时自动跑深度学习实验,不依赖LLM API,支持手机端监控,一天仅需5毛钱。


开源框架Deep Researcher Agent通过自主循环实现7x24小时自动跑深度学习实验,不依赖LLM API,支持手机端监控,一天仅需5毛钱。
做深度学习研究的人,大概都经历过这种循环:改超参 -> 跑训练 -> 等6小时 -> 看结果 -> 再改 -> 再跑。最让人崩溃的不是辛苦,是这件事本质上全是机械操作。Deep Researcher Agent 这个开源框架就是为了解决这个问题而生的——你睡觉的时候,它在炼丹;你写论文的时候,它已经把结果表准备好了。
它是一个开源的深度学习实验自动化框架,核心功能是让 AI Agent 按照 THINK -> EXECUTE -> MONITOR -> REFLECT 的循环,7x24 小时不间断地替你跑实验。不依赖 LLM API 做监控(训练期间零 API 开销),一天成本只要五毛钱。

项目地址:https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7
框架的核心是一个自主循环,分为四个阶段:

Agent 读取项目说明和历史实验记忆,分析当前最优结果,决定下一步该试什么。它不只是改超参,还能改模型代码、换 loss 函数、加数据增强策略。
Agent 自动改代码或配置,先跑一个强制 dry-run(2 步前向反向)确认没有 bug,然后才把真正的训练提交到 GPU 上。
这是整个项目最关键的设计:训练期间,Agent 完全不调用 LLM API。它只做三件事:
kill -0 $PID -- 检查进程是否存活nvidia-smi -- 检查 GPU 是否在工作tail -- 查看日志最后几行这三个操作的 API 成本是零。
训练结束后,Agent 解析日志、提取指标、与历史最优对比、记录里程碑,然后开启下一轮循环。
24/7 跑 LLM Agent,为什么这么便宜?
关键就在「零成本 MONITOR」。一天 24 小时里,90% 以上的时间都在训练,这段时间 LLM 调用费为零。只有开头的「想方案」和结尾的「看结果」才需要调用大模型,每次几分钟。

长时间运行的 Agent 有个经典问题:上下文越积越长,又慢又贵又蠢。Deep Researcher Agent 的解法是一个两层记忆系统:
总记忆量恒定在约 5000 字符。跑 1 天是这个数,跑 6 个月还是这个数。
这个框架已经在多个真实研究项目中连续跑了 30 多天:
框架不绑定单一 LLM,config 改一行就能切换:
安装只需要两步:
git clone https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7.git
cd auto-deep-researcher-24x7
python install.py安装完成后,你会获得 7 个 Claude Code / Codex 斜杠命令,可以直接用来管理实验循环。

如果你完全不会用,仓库里有个 AI_GUIDE.md 文件,把它直接丢给任何 AI 助手,它会交互式地一步步带你装好、跑起第一个实验。
配合 Happy Coder App(iOS / Android),你可以在手机上:
端到端加密,代码和结果完全私密。

如果你是深度学习研究者,经常需要在 deadline 前反复调参跑实验,Deep Researcher Agent 能帮你把机械性的操作环节全部自动化。你只需要提供 idea 和判断,跑实验的事交给它。

清华大学开源的自适应图像生成框架,通过强化学习为每个样本量身定制最优策略,在四大主流生成范式上实现最高54%性能提升

字节跳动扣子 2.5 版本正式上线,支持手机对话编程、云电脑云手机、工作流创建、视频生成等功能,配备长期记忆和专属日程系统,可 7x24 小时后台执行任务。

谷歌官方发布 Gemma 4 + OpenClaw 三步接入教程,通过 Ollama 本地部署,推荐 26B A4B 版本,Mac Studio M4 Pro 48GB 即可运行,不再花钱买 Token