toolin.ai logo
toolin.ai
首页
所有AI工具
AI技能包
AI资讯
精选推文
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具802个
技能包11个
产品功能
  • 所有AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策
OpenResearcher:开源深度研究 Agent 训练流水线,30B 模型超越 GPT-4.1
2026/03/29

OpenResearcher:开源深度研究 Agent 训练流水线,30B 模型超越 GPT-4.1

OpenResearcher 提供完整开源的深度研究轨迹合成流水线,9.7 万条长程训练数据免费可用,微调后 30B 模型在 BrowseComp-Plus 达到 54.8% 准确率,超越多个主流闭源模型。

训练一个能真正「搜索 → 浏览 → 推理」的深度研究 Agent,最大的瓶颈不是模型本身,而是缺乏高质量的长程研究轨迹数据。Texas A&M、Waterloo、UC San Diego 等机构联合推出的 OpenResearcher,是目前第一个完全开源、可本地复现的深度研究轨迹合成流水线,合成数据已被 NVIDIA 采用于基座模型训练。

OpenResearcher 是什么

OpenResearcher 不是一个直接使用的研究工具,而是一条训练深度研究 Agent 的数据合成流水线。它解决的问题是:如何在不依赖昂贵在线 API 的情况下,批量生成包含 100+ 轮工具调用的长程研究轨迹,用于微调小参数量模型。

核心思路:一次性抓取在线语料构建包含 1500 万篇候选文档的本地搜索引擎,由教师模型在完全离线环境中调用 search、open、find 三种工具合成研究轨迹。

核心数据

  • 合成轨迹总量:9.7 万条,大量轨迹包含 100 次以上工具调用
  • 微调基座:30B 参数模型(NVIDIA 基座)
  • BrowseComp-Plus 准确率:54.8%,较基座模型提升 34 个百分点
  • 对比闭源模型:超越 GPT-4.1(36.4%)、Claude-4-Opus(36.8%)、Gemini-2.5-Pro
  • 数据来源:纯离线合成,无需在线训练

BrowseComp-Plus 基准测试结果,OpenResearcher 30B 高居左上角

OpenResearcher 30B 在参数量/性能比维度上显著领先所有对比模型。

核心功能

离线轨迹合成

传统方案每次失败的搜索路径都消耗 API 配额,大规模合成意味着数万美元开支。OpenResearcher 将所有文档本地化,教师模型在离线环境中完成全部合成,成本大幅降低。

三工具调用体系

Agent 在合成过程中只使用三种原子工具,结构简洁易于迁移:

  • search:在本地语料库中检索相关文档
  • open:打开并读取指定文档全文
  • find:在文档内精准定位特定信息

长程推理轨迹

现有开源数据集多为 2-5 轮浅层交互,无法覆盖真实深度研究场景。OpenResearcher 的轨迹平均工具调用次数远超现有数据集,是训练长程推理能力的关键差异点。

应用场景

  • AI 研究团队:用开源流水线替代昂贵的在线 API 合成方案,自建高质量训练数据
  • 中小团队:无需 GPT-4 级别的闭源模型,用 30B 开源模型即可获得同等深度研究能力
  • 企业私有化部署:全离线流水线,数据不出本地网络

资源链接

资源链接
论文https://arxiv.org/abs/2603.20278
代码仓库https://github.com/TIGER-AI-Lab/OpenResearcher
模型权重https://huggingface.co/OpenResearcher/OpenResearcher-30B-A3B
训练数据集https://huggingface.co/datasets/OpenResearcher/OpenResearcher-Dataset
在线 Demohttps://huggingface.co/spaces/OpenResearcher/OpenResearcher
技术博客https://boiled-honeycup-4c7.notion.site/OpenResearcher

使用门槛

  • 需要具备模型微调经验(SFT 流程)
  • 本地语料库构建需要足够的存储空间(1500 万篇文档)
  • 教师模型推理需要 GPU 资源
  • 不适合直接作为终端用户工具使用,定位是研究和工程团队的基础设施
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
OpenResearcher 是什么核心数据核心功能离线轨迹合成三工具调用体系长程推理轨迹应用场景资源链接使用门槛

相关文章

飞书开源 CLI 工具:让 AI Agent 直接操作办公软件
AI产品

飞书开源 CLI 工具:让 AI Agent 直接操作办公软件

飞书开源 lark-cli,覆盖 11 大业务域、200+ 命令,支持 Claude Code、Cursor 等主流 AI 工具直接调用飞书能力,Star 数已达 5.5k

avatar for toolin小编
toolin小编
3天前
即梦 CLI 上线:在智能体里直接调用 Seedance 2.0 生成视频
AI产品

即梦 CLI 上线:在智能体里直接调用 Seedance 2.0 生成视频

即梦推出 CLI 工具,支持在小龙虾、Claude Code 等智能体中通过自然语言直接调用 Seedance 2.0 生成视频和图片,无需 API 配置

avatar for toolin小编
toolin小编
3天前
Qwen3.5-Omni 实测:全模态原生感知,摄像头下的 AI 编程大师
AI产品

Qwen3.5-Omni 实测:全模态原生感知,摄像头下的 AI 编程大师

通义千问 Qwen3.5-Omni 正式发布,支持文本、图片、音视频原生输入。实测具备超强的视觉代码理解能力,可实时解读论文并生成对应代码。

avatar for toolin小编
toolin小编
4天前