toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具847个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策
DeepXiv:让AI Agent直接消费2亿篇论文的CLI工具
2026/04/09

DeepXiv:让AI Agent直接消费2亿篇论文的CLI工具

DeepXiv开源CLI工具,将2亿+开放论文转化为Agent可调用的数据接口,支持搜索、渐进式阅读、热点追踪和深度调研。

如果你在做AI相关的研发,大概率每天都在和论文打交道。但目前的论文阅读方式仍然是为人类设计的——打开网页、下载PDF、手动翻页。对于越来越依赖AI Agent辅助工作的开发者来说,这套流程效率太低。

DeepXiv 要解决的问题很直接:让论文从"给人看"升级为"给Agent用"。它把2亿+开放论文转化为Agent可以直接调用的数据接口和技能系统,支持命令行、Python SDK和MCP协议三种接入方式。

项目由智源研究院联合高校与社区开发者共同研发,已完全开源。

资源链接

  • GitHub:https://github.com/DeepXiv/deepxiv_sdk
  • PyPI:https://pypi.org/project/deepxiv-sdk/
  • API 文档:https://data.rag.ac.cn/api/docs
  • 技术报告:https://arxiv.org/abs/2603.00084

DeepXiv整体架构

这个教程能帮你做什么

学完本教程,你可以用命令行完成以下工作:

  • 搜索特定主题的论文,并按时间过滤
  • 快速预览论文核心信息(标题、摘要、关键词)
  • 按章节精准读取论文内容
  • 追踪研究热点和论文传播热度
  • 自动生成某个方向的Baseline对比表格

适合人群:科研工作者、AI开发者、需要文献调研的工程师。

开始前的准备

  • Python 3.8+
  • pip 包管理器
  • 预计时间:10分钟上手
  • 成本:免费

第一步:安装 DeepXiv SDK

一行命令搞定安装:

pip install deepxiv-sdk

如果需要完整的深度调研Agent功能(包含内置Agent):

pip install "deepxiv-sdk[all]"

第二步:搜索论文

DeepXiv 自建了论文搜索引擎,支持关键词搜索和时间范围过滤:

# 基础搜索
deepxiv search "agent memory"

# 按时间范围过滤,限制返回数量,输出JSON格式
deepxiv search "agentic memory" --date-from 2026-03-02 --limit 50 --format json

# 多近义词并行搜索,扩大召回范围
deepxiv search "memory agents long-horizon" --date-from 2026-03-02 --limit 50 --format json

搜索结果会返回论文ID、标题、摘要等结构化信息,方便后续处理。

搜索结果示例

第三步:渐进式阅读论文

DeepXiv 的核心理念是渐进披露——先用最低成本判断论文价值,再按需深入阅读。

快速预览(--brief)

deepxiv paper 2602.16493 --brief

这会返回论文的标题、发表日期、引用数、PDF链接、GitHub地址、关键词和TL;DR摘要。Token消耗极低,适合批量筛选。

查看结构(--head)

deepxiv paper 2602.16493 --head

返回论文的章节分布和各章节的摘要、Token数。帮你快速了解全文结构,判断哪些章节值得深入阅读。

精读章节(--section)

deepxiv paper 2602.16493 --section "Experiments"

只读取实验部分的内容。DeepXiv 返回的是解析后的 Markdown 或 JSON 格式,Agent 可以直接消费,无需从 PDF 中提取。

论文结构查看

提示: 这三个命令对应的是一个非常自然的文献阅读路径:搜索候选 -> 预览筛选 -> 结构定位 -> 定点精读。每个阶段的Token消耗递增,你可以在任意阶段停下来。

第四步:追踪研究热点

DeepXiv 内置了热点追踪能力:

# 获取近7天热点论文
deepxiv trending --days 7 --limit 30 --json

# 预览单篇论文要点
deepxiv paper 2603.28767 --brief

# 查看论文的社交媒体传播热度
deepxiv paper 2603.28767 --popularity

第五步:深度调研(Agent模式)

如果不想手动拼接每一步调用,DeepXiv 内置了深度调研 Agent,可以把搜索、筛选、阅读、提取和归纳串成一条完整链路:

# 安装完整依赖
pip install "deepxiv-sdk[all]"

# 配置API key
deepxiv agent config

# 开始深度调研
deepxiv agent query "What are the latest papers about agent memory?" --verbose

其他接入方式

除了CLI,DeepXiv 还支持:

  • Python SDK:直接在代码中调用,适合集成到自定义Agent
  • MCP协议:可以嵌入 Claude Code、OpenClaw 等主流Agent开发框架
  • PMC支持:除了ArXiv,已经开始接入 PubMed Central 等更多文献源
# 查看PMC论文
deepxiv pmc PMC544940 --head
deepxiv pmc PMC544940

常见问题

  • 数据覆盖范围:目前已覆盖全量ArXiv数据,每日增量更新,正在扩展至PMC、ACM、bioRxiv等更多文献源
  • 是否免费:开源免费使用
  • 返回格式:支持JSON和Markdown两种格式
  • MCP怎么接入:DeepXiv 提供MCP Server,可直接在支持的Agent框架中注册为工具

自动生成的Baseline表格

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI教程
资源链接这个教程能帮你做什么开始前的准备第一步:安装 DeepXiv SDK第二步:搜索论文第三步:渐进式阅读论文快速预览(--brief)查看结构(--head)精读章节(--section)第四步:追踪研究热点第五步:深度调研(Agent模式)其他接入方式常见问题

相关文章

VoxCPM 2:开源2B语音模型,30种语言9种方言
AI产品

VoxCPM 2:开源2B语音模型,30种语言9种方言

面壁智能开源2B语音模型VoxCPM 2,支持30种语言、9种中国方言、声音克隆、音色设计与情绪控制,48kHz CD音质,免费商用。

avatar for toolin小编
toolin小编
1天前
MemPalace:免费本地AI记忆系统,GitHub爆火
AI产品

MemPalace:免费本地AI记忆系统,GitHub爆火

开源AI记忆系统MemPalace采用记忆宫殿法,LongMemEval得分96.6%,支持本地运行、MCP接入,年成本仅10美元

avatar for toolin小编
toolin小编
1天前
飞书钉钉企微齐出CLI,Agent原生工具怎么用
AI教程

飞书钉钉企微齐出CLI,Agent原生工具怎么用

飞书、钉钉、企业微信相继推出命令行工具,Karpathy强推CLI复兴趋势,本文教你如何用CLI让AI Agent直接操作企业软件。

avatar for toolin小编
toolin小编
3天前