开源Agent Harness框架,通过智能路由、上下文管理和自进化机制,将Agent的token成本降低50%以上。


开源Agent Harness框架,通过智能路由、上下文管理和自进化机制,将Agent的token成本降低50%以上。
如果你在做 AI Agent 产品,token 账单大概率已经让你头疼了。Agent 比聊天机器人费 token 得多——一次任务背后可能跑十几步,每一步都在烧钱。而且不是每一步都需要最强的模型,分类、摘要、格式整理这些简单任务,用旗舰模型就是浪费。
OpenSquilla 是一个开源的 Agent Harness 框架,它在 Agent 应用和大模型之间加了一层"运行中枢",核心目标只有一个:让 Agent 少花不该花的 token,同时让它越用越懂用户。
OpenSquilla 是一个四层架构的中间件框架,部署在 Agent 应用和底层大模型之间。它不替代模型本身,而是管理"调哪个模型、喂多少上下文、怎么编排任务、如何持续进化"这几个关键决策。

OpenSquilla 在 Agent 应用和模型之间的四层架构:智能路由、上下文管理、MetaSkill 编排、自进化机制。
大多数 Agent 团队的做法是绑定一个主力模型。效果稳定,开发省事,但账单很快失控。
OpenSquilla 在任务进入大模型之前,先用本地路由模型判断任务复杂度。它根据语义、关键词、语言、上下文长度、对话轮次等特征,把任务分成不同等级,再匹配不同模型。
关键区别在于:这个路由不是静态规则表,而是一个可以根据任务反馈持续优化的参数化模型。哪些任务成功了、哪些地方烧 token、哪些模型性价比更高,这些信号会回流到路由中,不断训练它。
据团队数据,OpenSquilla 的智能路由比 OpenRouter 路由精度高 4.4 个百分点,成本低 75%。
很多 Agent 系统会把 Skill 描述、工具说明、历史记忆、网页内容一股脑塞进 prompt。模型每调用一次都要重新读一遍,用不到的 token 也照样计费。
OpenSquilla 的做法:
据团队数据,上下文管理可额外带来约 20% 到 50% 的成本降低。
Skill 越多,Agent 理论上越强。但真实使用中,用户开始不知道该怎么组合这些 Skill。写一篇文章,要先查资料、核事实、学风格、写初稿、审校——每一步都有 Skill,但谁来编排顺序?
OpenSquilla 的 MetaSkill 机制让用户只需要说目标,AI 自动拆步骤、选 Skill 组合、安排依赖关系。每个步骤独享一段上下文,避免互相干扰。

用户第一次让 Agent 做任务,往往要改好几轮。问题是改完了下次还犯同样的错,经验没有沉淀。
OpenSquilla 会回看整个交互过程:用户补了哪些条件、纠正了哪些偏差、最终认可了什么结果,然后把这些信息沉淀进 Skill 或工作流。下次遇到类似任务,Agent 不必从零开始。
用户少纠正一次 = 系统少跑一轮 = 少烧一轮 token。
提示: OpenSquilla 的路由模型是本地运行的集成树模型,不需要额外调用大模型 API,本身不产生额外的 token 开销。

iOS 27中Siri获得独立App形态,支持多轮对话和屏幕感知,Apple Intelligence深度整合灵动岛,但国行用户暂时无法使用

微信AI开放开发者接入,支持自动模式和开发模式,将小程序转化为AI可调用的Agent技能,零代码即可接入

VideoClaw和JoyAI-Echo两大开源框架同日发布,分别用多智能体协作和跨模态记忆库解决AI长视频一致性问题,本文对比两者技术方案。