toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,118个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

OpenResearcher:开源深度研究 Agent 训练流水线,30B 模型超越 GPT-4.1

2026/03/29
·toolin小编

OpenResearcher 提供完整开源的深度研究轨迹合成流水线,9.7 万条长程训练数据免费可用,微调后 30B 模型在 BrowseComp-Plus 达到 54.8% 准确率,超越多个主流闭源模型。

OpenResearcher:开源深度研究 Agent 训练流水线,30B 模型超越 GPT-4.1
OpenResearcher:开源深度研究 Agent 训练流水线,30B 模型超越 GPT-4.1
2026/03/29

OpenResearcher:开源深度研究 Agent 训练流水线,30B 模型超越 GPT-4.1

OpenResearcher 提供完整开源的深度研究轨迹合成流水线,9.7 万条长程训练数据免费可用,微调后 30B 模型在 BrowseComp-Plus 达到 54.8% 准确率,超越多个主流闭源模型。

OpenResearcher 是什么核心数据核心功能离线轨迹合成三工具调用体系长程推理轨迹应用场景资源链接使用门槛
AI产品

训练一个能真正「搜索 → 浏览 → 推理」的深度研究 Agent,最大的瓶颈不是模型本身,而是缺乏高质量的长程研究轨迹数据。Texas A&M、Waterloo、UC San Diego 等机构联合推出的 OpenResearcher,是目前第一个完全开源、可本地复现的深度研究轨迹合成流水线,合成数据已被 NVIDIA 采用于基座模型训练。

OpenResearcher 是什么

OpenResearcher 不是一个直接使用的研究工具,而是一条训练深度研究 Agent 的数据合成流水线。它解决的问题是:如何在不依赖昂贵在线 API 的情况下,批量生成包含 100+ 轮工具调用的长程研究轨迹,用于微调小参数量模型。

核心思路:一次性抓取在线语料构建包含 1500 万篇候选文档的本地搜索引擎,由教师模型在完全离线环境中调用 search、open、find 三种工具合成研究轨迹。

核心数据

  • 合成轨迹总量:9.7 万条,大量轨迹包含 100 次以上工具调用
  • 微调基座:30B 参数模型(NVIDIA 基座)
  • BrowseComp-Plus 准确率:54.8%,较基座模型提升 34 个百分点
  • 对比闭源模型:超越 GPT-4.1(36.4%)、Claude-4-Opus(36.8%)、Gemini-2.5-Pro
  • 数据来源:纯离线合成,无需在线训练

BrowseComp-Plus 基准测试结果,OpenResearcher 30B 高居左上角

OpenResearcher 30B 在参数量/性能比维度上显著领先所有对比模型。

核心功能

离线轨迹合成

传统方案每次失败的搜索路径都消耗 API 配额,大规模合成意味着数万美元开支。OpenResearcher 将所有文档本地化,教师模型在离线环境中完成全部合成,成本大幅降低。

三工具调用体系

Agent 在合成过程中只使用三种原子工具,结构简洁易于迁移:

  • search:在本地语料库中检索相关文档
  • open:打开并读取指定文档全文
  • find:在文档内精准定位特定信息

长程推理轨迹

现有开源数据集多为 2-5 轮浅层交互,无法覆盖真实深度研究场景。OpenResearcher 的轨迹平均工具调用次数远超现有数据集,是训练长程推理能力的关键差异点。

应用场景

  • AI 研究团队:用开源流水线替代昂贵的在线 API 合成方案,自建高质量训练数据
  • 中小团队:无需 GPT-4 级别的闭源模型,用 30B 开源模型即可获得同等深度研究能力
  • 企业私有化部署:全离线流水线,数据不出本地网络

资源链接

资源链接
论文https://arxiv.org/abs/2603.20278
代码仓库https://github.com/TIGER-AI-Lab/OpenResearcher
模型权重https://huggingface.co/OpenResearcher/OpenResearcher-30B-A3B
训练数据集https://huggingface.co/datasets/OpenResearcher/OpenResearcher-Dataset
在线 Demohttps://huggingface.co/spaces/OpenResearcher/OpenResearcher
技术博客https://boiled-honeycup-4c7.notion.site/OpenResearcher

使用门槛

  • 需要具备模型微调经验(SFT 流程)
  • 本地语料库构建需要足够的存储空间(1500 万篇文档)
  • 教师模型推理需要 GPU 资源
  • 不适合直接作为终端用户工具使用,定位是研究和工程团队的基础设施
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
OpenResearcher 是什么核心数据核心功能离线轨迹合成三工具调用体系长程推理轨迹应用场景资源链接使用门槛

相关文章

腾讯Marvis:让电脑自己收拾自己的AI助手
AI产品

腾讯Marvis:让电脑自己收拾自己的AI助手

腾讯内测AI桌面助手Marvis,支持自然语言操控文件管理、系统设置、跨端操作,提供隐私模式完全本地运行。

avatar for toolin小编
toolin小编
1天前
Claude Mythos:单月猎杀 423 个安全漏洞的 AI 猎手
AI产品

Claude Mythos:单月猎杀 423 个安全漏洞的 AI 猎手

Claude Mythos Preview 帮助 Firefox 团队一个月修复 423 个安全漏洞,含 180 个高危漏洞和多个沙箱逃逸,含藏了 20 年的老 Bug。

avatar for toolin小编
toolin小编
4小时前
JiuwenSwarm开源:多AI智能体蜂群协作框架
AI产品

JiuwenSwarm开源:多AI智能体蜂群协作框架

华为支持的openJiuwen社区开源JiuwenSwarm,提供多Agent协同、技能沉淀、自演进的全栈框架,支持医疗、教育、内容创作等多场景。

avatar for toolin小编
toolin小编
1天前