OpenResearcher：开源深度研究 Agent 训练流水线，30B 模型超越 GPT-4.1

训练一个能真正「搜索 → 浏览 → 推理」的深度研究 Agent，最大的瓶颈不是模型本身，而是缺乏高质量的长程研究轨迹数据。Texas A&M、Waterloo、UC San Diego 等机构联合推出的 OpenResearcher，是目前第一个完全开源、可本地复现的深度研究轨迹合成流水线，合成数据已被 NVIDIA 采用于基座模型训练。

OpenResearcher 是什么

OpenResearcher 不是一个直接使用的研究工具，而是一条训练深度研究 Agent 的数据合成流水线。它解决的问题是：如何在不依赖昂贵在线 API 的情况下，批量生成包含 100+ 轮工具调用的长程研究轨迹，用于微调小参数量模型。

核心思路：一次性抓取在线语料构建包含 1500 万篇候选文档的本地搜索引擎，由教师模型在完全离线环境中调用 search、open、find 三种工具合成研究轨迹。

核心数据

合成轨迹总量：9.7 万条，大量轨迹包含 100 次以上工具调用
微调基座：30B 参数模型（NVIDIA 基座）
BrowseComp-Plus 准确率：54.8%，较基座模型提升 34 个百分点
对比闭源模型：超越 GPT-4.1（36.4%）、Claude-4-Opus（36.8%）、Gemini-2.5-Pro
数据来源：纯离线合成，无需在线训练

BrowseComp-Plus 基准测试结果，OpenResearcher 30B 高居左上角

OpenResearcher 30B 在参数量/性能比维度上显著领先所有对比模型。

search：在本地语料库中检索相关文档
open：打开并读取指定文档全文
find：在文档内精准定位特定信息

长程推理轨迹

现有开源数据集多为 2-5 轮浅层交互，无法覆盖真实深度研究场景。OpenResearcher 的轨迹平均工具调用次数远超现有数据集，是训练长程推理能力的关键差异点。

应用场景

AI 研究团队：用开源流水线替代昂贵的在线 API 合成方案，自建高质量训练数据
中小团队：无需 GPT-4 级别的闭源模型，用 30B 开源模型即可获得同等深度研究能力
企业私有化部署：全离线流水线，数据不出本地网络

资源链接

资源	链接
论文	https://arxiv.org/abs/2603.20278
代码仓库	https://github.com/TIGER-AI-Lab/OpenResearcher
模型权重	https://huggingface.co/OpenResearcher/OpenResearcher-30B-A3B
训练数据集	https://huggingface.co/datasets/OpenResearcher/OpenResearcher-Dataset
在线 Demo	https://huggingface.co/spaces/OpenResearcher/OpenResearcher
技术博客	https://boiled-honeycup-4c7.notion.site/OpenResearcher

使用门槛

需要具备模型微调经验（SFT 流程）
本地语料库构建需要足够的存储空间（1500 万篇文档）
教师模型推理需要 GPU 资源
不适合直接作为终端用户工具使用，定位是研究和工程团队的基础设施

OpenResearcher 是什么

核心数据

合成轨迹总量：9.7 万条，大量轨迹包含 100 次以上工具调用
微调基座：30B 参数模型（NVIDIA 基座）
BrowseComp-Plus 准确率：54.8%，较基座模型提升 34 个百分点
对比闭源模型：超越 GPT-4.1（36.4%）、Claude-4-Opus（36.8%）、Gemini-2.5-Pro
数据来源：纯离线合成，无需在线训练

BrowseComp-Plus 基准测试结果，OpenResearcher 30B 高居左上角

OpenResearcher 30B 在参数量/性能比维度上显著领先所有对比模型。

search：在本地语料库中检索相关文档
open：打开并读取指定文档全文
find：在文档内精准定位特定信息

长程推理轨迹

应用场景

AI 研究团队：用开源流水线替代昂贵的在线 API 合成方案，自建高质量训练数据
中小团队：无需 GPT-4 级别的闭源模型，用 30B 开源模型即可获得同等深度研究能力
企业私有化部署：全离线流水线，数据不出本地网络

资源链接

资源	链接
论文	https://arxiv.org/abs/2603.20278
代码仓库	https://github.com/TIGER-AI-Lab/OpenResearcher
模型权重	https://huggingface.co/OpenResearcher/OpenResearcher-30B-A3B
训练数据集	https://huggingface.co/datasets/OpenResearcher/OpenResearcher-Dataset
在线 Demo	https://huggingface.co/spaces/OpenResearcher/OpenResearcher
技术博客	https://boiled-honeycup-4c7.notion.site/OpenResearcher

使用门槛

需要具备模型微调经验（SFT 流程）
本地语料库构建需要足够的存储空间（1500 万篇文档）
教师模型推理需要 GPU 资源
不适合直接作为终端用户工具使用，定位是研究和工程团队的基础设施

全部

AI教程

AI产品

AI资源

OpenResearcher：开源深度研究 Agent 训练流水线，30B 模型超越 GPT-4.1

OpenResearcher：开源深度研究 Agent 训练流水线，30B 模型超越 GPT-4.1

OpenResearcher 是什么

核心数据

核心功能

离线轨迹合成

三工具调用体系

长程推理轨迹

应用场景

资源链接

使用门槛

作者

分类

相关文章

Codex 三种电脑操作模式使用指南

DeepSeek Deep Code：Claude Code 的国产终端替代

Claude Science：科研界的 Claude Code，附免费开源平替

OpenResearcher：开源深度研究 Agent 训练流水线，30B 模型超越 GPT-4.1

OpenResearcher：开源深度研究 Agent 训练流水线，30B 模型超越 GPT-4.1

OpenResearcher 是什么

核心数据

核心功能

离线轨迹合成

三工具调用体系

长程推理轨迹

应用场景

资源链接

使用门槛

作者

分类

相关文章

Codex 三种电脑操作模式使用指南

DeepSeek Deep Code：Claude Code 的国产终端替代

Claude Science：科研界的 Claude Code，附免费开源平替