DeepXiv：让AI Agent直接消费2亿篇论文的CLI工具

# 基础搜索
deepxiv search "agent memory"

# 按时间范围过滤，限制返回数量，输出JSON格式
deepxiv search "agentic memory" --date-from 2026-03-02 --limit 50 --format json

# 多近义词并行搜索，扩大召回范围
deepxiv search "memory agents long-horizon" --date-from 2026-03-02 --limit 50 --format json

搜索结果会返回论文ID、标题、摘要等结构化信息，方便后续处理。

搜索结果示例

第三步：渐进式阅读论文

DeepXiv 的核心理念是渐进披露——先用最低成本判断论文价值，再按需深入阅读。

快速预览（`--brief`）

deepxiv paper 2602.16493 --brief

这会返回论文的标题、发表日期、引用数、PDF链接、GitHub地址、关键词和TL;DR摘要。Token消耗极低，适合批量筛选。

查看结构（`--head`）

deepxiv paper 2602.16493 --head

返回论文的章节分布和各章节的摘要、Token数。帮你快速了解全文结构，判断哪些章节值得深入阅读。

精读章节（`--section`）

deepxiv paper 2602.16493 --section "Experiments"

只读取实验部分的内容。DeepXiv 返回的是解析后的 Markdown 或 JSON 格式，Agent 可以直接消费，无需从 PDF 中提取。

提示: 这三个命令对应的是一个非常自然的文献阅读路径：搜索候选 -> 预览筛选 -> 结构定位 -> 定点精读。每个阶段的Token消耗递增，你可以在任意阶段停下来。

第四步：追踪研究热点

DeepXiv 内置了热点追踪能力：

# 获取近7天热点论文
deepxiv trending --days 7 --limit 30 --json

# 预览单篇论文要点
deepxiv paper 2603.28767 --brief

# 查看论文的社交媒体传播热度
deepxiv paper 2603.28767 --popularity

第五步：深度调研（Agent模式）

如果不想手动拼接每一步调用，DeepXiv 内置了深度调研 Agent，可以把搜索、筛选、阅读、提取和归纳串成一条完整链路：

# 安装完整依赖
pip install "deepxiv-sdk[all]"

# 配置API key
deepxiv agent config

# 开始深度调研
deepxiv agent query "What are the latest papers about agent memory?" --verbose

其他接入方式

除了CLI，DeepXiv 还支持：

Python SDK：直接在代码中调用，适合集成到自定义Agent
MCP协议：可以嵌入 Claude Code、OpenClaw 等主流Agent开发框架
PMC支持：除了ArXiv，已经开始接入 PubMed Central 等更多文献源

# 查看PMC论文
deepxiv pmc PMC544940 --head
deepxiv pmc PMC544940

常见问题

数据覆盖范围：目前已覆盖全量ArXiv数据，每日增量更新，正在扩展至PMC、ACM、bioRxiv等更多文献源
是否免费：开源免费使用
返回格式：支持JSON和Markdown两种格式
MCP怎么接入：DeepXiv 提供MCP Server，可直接在支持的Agent框架中注册为工具

自动生成的Baseline表格

项目由智源研究院联合高校与社区开发者共同研发，已完全开源。

资源链接

GitHub：https://github.com/DeepXiv/deepxiv_sdk
PyPI：https://pypi.org/project/deepxiv-sdk/
API 文档：https://data.rag.ac.cn/api/docs
技术报告：https://arxiv.org/abs/2603.00084

DeepXiv整体架构

这个教程能帮你做什么

学完本教程，你可以用命令行完成以下工作：

搜索特定主题的论文，并按时间过滤
快速预览论文核心信息（标题、摘要、关键词）
按章节精准读取论文内容
追踪研究热点和论文传播热度
自动生成某个方向的Baseline对比表格

适合人群：科研工作者、AI开发者、需要文献调研的工程师。

开始前的准备

Python 3.8+
pip 包管理器
预计时间：10分钟上手
成本：免费

第一步：安装 DeepXiv SDK

一行命令搞定安装：

pip install deepxiv-sdk

如果需要完整的深度调研Agent功能（包含内置Agent）：

pip install "deepxiv-sdk[all]"

第二步：搜索论文

DeepXiv 自建了论文搜索引擎，支持关键词搜索和时间范围过滤：

# 基础搜索
deepxiv search "agent memory"

# 按时间范围过滤，限制返回数量，输出JSON格式
deepxiv search "agentic memory" --date-from 2026-03-02 --limit 50 --format json

# 多近义词并行搜索，扩大召回范围
deepxiv search "memory agents long-horizon" --date-from 2026-03-02 --limit 50 --format json

搜索结果会返回论文ID、标题、摘要等结构化信息，方便后续处理。

搜索结果示例

第三步：渐进式阅读论文

DeepXiv 的核心理念是渐进披露——先用最低成本判断论文价值，再按需深入阅读。

快速预览（`--brief`）

deepxiv paper 2602.16493 --brief

这会返回论文的标题、发表日期、引用数、PDF链接、GitHub地址、关键词和TL;DR摘要。Token消耗极低，适合批量筛选。

查看结构（`--head`）

deepxiv paper 2602.16493 --head

返回论文的章节分布和各章节的摘要、Token数。帮你快速了解全文结构，判断哪些章节值得深入阅读。

精读章节（`--section`）

deepxiv paper 2602.16493 --section "Experiments"

只读取实验部分的内容。DeepXiv 返回的是解析后的 Markdown 或 JSON 格式，Agent 可以直接消费，无需从 PDF 中提取。

提示: 这三个命令对应的是一个非常自然的文献阅读路径：搜索候选 -> 预览筛选 -> 结构定位 -> 定点精读。每个阶段的Token消耗递增，你可以在任意阶段停下来。

第四步：追踪研究热点

DeepXiv 内置了热点追踪能力：

# 获取近7天热点论文
deepxiv trending --days 7 --limit 30 --json

# 预览单篇论文要点
deepxiv paper 2603.28767 --brief

# 查看论文的社交媒体传播热度
deepxiv paper 2603.28767 --popularity

第五步：深度调研（Agent模式）

如果不想手动拼接每一步调用，DeepXiv 内置了深度调研 Agent，可以把搜索、筛选、阅读、提取和归纳串成一条完整链路：

# 安装完整依赖
pip install "deepxiv-sdk[all]"

# 配置API key
deepxiv agent config

# 开始深度调研
deepxiv agent query "What are the latest papers about agent memory?" --verbose

其他接入方式

除了CLI，DeepXiv 还支持：

Python SDK：直接在代码中调用，适合集成到自定义Agent
MCP协议：可以嵌入 Claude Code、OpenClaw 等主流Agent开发框架
PMC支持：除了ArXiv，已经开始接入 PubMed Central 等更多文献源

# 查看PMC论文
deepxiv pmc PMC544940 --head
deepxiv pmc PMC544940

常见问题

数据覆盖范围：目前已覆盖全量ArXiv数据，每日增量更新，正在扩展至PMC、ACM、bioRxiv等更多文献源
是否免费：开源免费使用
返回格式：支持JSON和Markdown两种格式
MCP怎么接入：DeepXiv 提供MCP Server，可直接在支持的Agent框架中注册为工具

自动生成的Baseline表格

全部

AI教程

AI产品

AI资源

DeepXiv：让AI Agent直接消费2亿篇论文的CLI工具

DeepXiv：让AI Agent直接消费2亿篇论文的CLI工具

作者

分类

相关文章

Claude Science：科研界的 Claude Code，附免费开源平替

Codex 开源模式：一行配置接入本地模型

MaineCoon：史上最快流式音视频社交模型

DeepXiv：让AI Agent直接消费2亿篇论文的CLI工具

DeepXiv：让AI Agent直接消费2亿篇论文的CLI工具

作者

分类

相关文章

Claude Science：科研界的 Claude Code，附免费开源平替

Codex 开源模式：一行配置接入本地模型

MaineCoon：史上最快流式音视频社交模型