toolin.ai logo
toolin.ai
首页
所有AI工具
AI技能包
AI资讯
精选推文
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具831个
技能包11个
产品功能
  • 所有AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策
编程智能体六大核心组件全解析
2026/04/07

编程智能体六大核心组件全解析

拆解 Claude Code、Codex CLI 等 AI 编程智能体的核心架构,涵盖代码仓库上下文、提示词缓存、工具调用、上下文瘦身、会话记忆和子智能体委派。

Claude Code 和 Codex CLI 为什么比直接在聊天框里用同款模型强那么多?答案不在模型本身,而在包裹在模型外面的那层「Coding harness」(编程运行框架)。本文拆解编程智能体的六大核心组件,帮你理解 Agent 为什么比裸模型好用,以及如何构建自己的编程智能体。

核心概念:模型 vs 智能体

先厘清三个关键概念:

  • 大语言模型 (LLM): 基础模型,本质是预测下一个词的引擎
  • 推理模型 (Reasoning Model): 经过特殊训练的 LLM,投入更多算力做中间推理和自我验证
  • 智能体 (Agent): 模型 + 工具 + 记忆 + 环境反馈的循环系统

一个类比:LLM 是普通发动机,推理模型是爆改后的高马力发动机,Agent harness 则是帮你驾驭发动机的整车系统。

模型与Agent的关系

基础模型、推理模型与 Agent 之间的关系。Agent 在特定环境里不断循环调用模型,处理真实开发中的复杂任务。

组件一:实时代码仓库上下文

这是最关键也最基础的组件。当你说「修一下测试代码」时,模型不能两眼一抹黑。它需要知道:

  • 当前是否在 Git 仓库里,在哪个分支
  • 项目有哪些文档、开发规范(如 AGENTS.md、README)
  • 代码库的文件结构

Coding harness 在收到指令后,会先收集这些信息,生成一份「工作区摘要」。这样模型面对每次提示时,都不是从零开始。

工作区摘要示意

Coding harness 先生成工作区摘要,再与用户请求合并,为模型提供充分的上下文。

组件二:提示词缓存复用

收集了上下文后,怎么高效地喂给模型?如果每次都把全部信息重新拼一遍,算力和成本浪费巨大。

核心策略:把提示词拆成「稳定的」和「变化的」两部分:

  • 稳定前缀(几乎不变):系统指令、工具说明、工作区摘要 -- 缓存复用
  • 变化部分(每轮更新):短期记忆、近期对话、最新指令 -- 每次重建

提示词结构

提示词分为稳定前缀和变化部分。主流 LLM API 都支持 Prompt Cache,缓存稳定前缀可以大幅降低成本。

组件三:工具的接入与调用

装在 Coding harness 里的 LLM 不只是提建议,它还能实打实地执行命令。但不是随意执行 -- Harness 提供预定义的工具箱,每个工具都有明确的输入要求和边界。

完整的工具调用流程:

  1. 模型输出结构化的动作请求
  2. Harness 验证动作(是否在白名单?参数是否合法?)
  3. 高危操作需要人工批准
  4. 执行动作,返回结果给模型
# Harness 的安全检查逻辑
def validate_tool(action):
    if action.tool not in KNOWN_TOOLS:
        return reject("未知工具")
    if not action.params_valid():
        return reject("参数非法")
    if action.is_dangerous() and not user_approved():
        return reject("需要人工批准")
    if action.path_outside_repo():
        return reject("路径越界")
    return execute(action)

组件四:上下文瘦身

编程智能体比普通聊天更容易「吃撑」上下文窗口,因为它频繁读取文件,工具输出往往又臭又长。优秀的 Harness 至少用两招应对:

  • 裁剪 (Clipping): 无情截断过长的文档片段和工具输出
  • 对话精简 (Transcript Reduction): 把完整历史提炼成轻量级摘要

核心秘诀:越近的事情保留细节越多,越久远的压缩越狠。早期读取的重复文件要做去重处理。

组件五:结构化会话记忆

编程智能体把状态分为两层:

层级存储内容大小用途
工作记忆核心关键点、当前任务、重要文件小保持任务连贯性
完整记录所有请求、工具输出、模型回答大支持会话恢复

会话记忆结构

工作记忆和完整记录通常以 JSON 格式存储在硬盘上,关闭智能体后下次打开可以无缝恢复。

组件六:任务委派与受限子智能体

把某些子任务分给子智能体并行处理,可以大幅加速主线任务。但关键在于约束:

  • 子智能体只能只读访问文件(或限制修改范围)
  • 限制递归深度,防止无限生成子智能体
  • 限制上下文大小和执行时间

子智能体既要继承足够的上下文来干活,又必须受到严格约束,这是设计上最考验功力的地方。

动手实践

Sebastian Raschka 用纯 Python 从零构建了一个 Mini Coding Agent,把上述六大组件全部实现,没有任何外部依赖。

  • 项目地址: https://github.com/rasbt/mini-coding-agent
  • 核心文件: mini_coding_agent.py,代码中用注释标注了六大组件的对应位置

如果你想深入理解编程智能体的内部机制,阅读这个项目的源码是最好的起点。

Mini Coding Agent

Mini Coding Agent 是一个极简但功能完整的编程智能体实现。

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI教程
核心概念:模型 vs 智能体组件一:实时代码仓库上下文组件二:提示词缓存复用组件三:工具的接入与调用组件四:上下文瘦身组件五:结构化会话记忆组件六:任务委派与受限子智能体动手实践

相关文章

Gemini 植入 Android 底层:你的手机开始主动帮你安排生活了

Gemini 植入 Android 底层:你的手机开始主动帮你安排生活了

Google 将 Gemini 植入 Android 系统底层,让它从聊天机器人变成主动规划的系统管家。月费 $19.99,能自动管理日程、邮件、出行安排,但也有权限和隐私方面的隐忧。

avatar for toolin小编
toolin小编
4天前
女娲.skill:用AI蒸馏任何人的思维框架
AI教程

女娲.skill:用AI蒸馏任何人的思维框架

开源工具女娲.skill可通过6个并行Agent从40多个信息源中提炼领域强者的心智模型和决策启发式,生成可对话的AI思维分身。

avatar for toolin小编
toolin小编
3天前
caveman:让 AI 编程助手少说废话,token 最高省 87%
AI教程

caveman:让 AI 编程助手少说废话,token 最高省 87%

一行命令安装的开源插件,让 Claude Code / Codex 像山顶洞人一样言简意赅,信息无损压缩输出 token,3 天 GitHub 4.1k Star。

avatar for toolin小编
toolin小编
1天前