toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,242个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

OpenSquilla:给Agent加上token省钱中间层

2026/06/06
·toolin小编

开源Agent Harness框架,通过智能路由、上下文管理和自进化机制,将Agent的token成本降低50%以上。

OpenSquilla:给Agent加上token省钱中间层
OpenSquilla:给Agent加上token省钱中间层
2026/06/06

OpenSquilla:给Agent加上token省钱中间层

开源Agent Harness框架,通过智能路由、上下文管理和自进化机制,将Agent的token成本降低50%以上。

OpenSquilla 是什么四层核心机制第一层:智能路由——调对模型省对钱第二层:上下文管理——别让模型读废话第三层:MetaSkill——让 Agent 自己组织能力第四层:自进化——把用户偏好训进 Harness适用场景
AI产品

如果你在做 AI Agent 产品,token 账单大概率已经让你头疼了。Agent 比聊天机器人费 token 得多——一次任务背后可能跑十几步,每一步都在烧钱。而且不是每一步都需要最强的模型,分类、摘要、格式整理这些简单任务,用旗舰模型就是浪费。

OpenSquilla 是一个开源的 Agent Harness 框架,它在 Agent 应用和大模型之间加了一层"运行中枢",核心目标只有一个:让 Agent 少花不该花的 token,同时让它越用越懂用户。

  • GitHub: https://github.com/opensquilla/opensquilla

OpenSquilla 是什么

OpenSquilla 是一个四层架构的中间件框架,部署在 Agent 应用和底层大模型之间。它不替代模型本身,而是管理"调哪个模型、喂多少上下文、怎么编排任务、如何持续进化"这几个关键决策。

Image

OpenSquilla 在 Agent 应用和模型之间的四层架构:智能路由、上下文管理、MetaSkill 编排、自进化机制。

四层核心机制

第一层:智能路由——调对模型省对钱

大多数 Agent 团队的做法是绑定一个主力模型。效果稳定,开发省事,但账单很快失控。

OpenSquilla 在任务进入大模型之前,先用本地路由模型判断任务复杂度。它根据语义、关键词、语言、上下文长度、对话轮次等特征,把任务分成不同等级,再匹配不同模型。

关键区别在于:这个路由不是静态规则表,而是一个可以根据任务反馈持续优化的参数化模型。哪些任务成功了、哪些地方烧 token、哪些模型性价比更高,这些信号会回流到路由中,不断训练它。

据团队数据,OpenSquilla 的智能路由比 OpenRouter 路由精度高 4.4 个百分点,成本低 75%。

第二层:上下文管理——别让模型读废话

很多 Agent 系统会把 Skill 描述、工具说明、历史记忆、网页内容一股脑塞进 prompt。模型每调用一次都要重新读一遍,用不到的 token 也照样计费。

OpenSquilla 的做法:

  • 按需加载 Skill:一次任务只注入可能用到的 Skill,不把几十个 Skill 的说明全部塞进去
  • 精准召回记忆:从本地数据库检索相关片段,而非整段搬入
  • 预处理工具结果:裁掉网页 HTML 中的标签、样式、导航栏、广告等无关内容

据团队数据,上下文管理可额外带来约 20% 到 50% 的成本降低。

第三层:MetaSkill——让 Agent 自己组织能力

Skill 越多,Agent 理论上越强。但真实使用中,用户开始不知道该怎么组合这些 Skill。写一篇文章,要先查资料、核事实、学风格、写初稿、审校——每一步都有 Skill,但谁来编排顺序?

OpenSquilla 的 MetaSkill 机制让用户只需要说目标,AI 自动拆步骤、选 Skill 组合、安排依赖关系。每个步骤独享一段上下文,避免互相干扰。

Image

第四层:自进化——把用户偏好训进 Harness

用户第一次让 Agent 做任务,往往要改好几轮。问题是改完了下次还犯同样的错,经验没有沉淀。

OpenSquilla 会回看整个交互过程:用户补了哪些条件、纠正了哪些偏差、最终认可了什么结果,然后把这些信息沉淀进 Skill 或工作流。下次遇到类似任务,Agent 不必从零开始。

用户少纠正一次 = 系统少跑一轮 = 少烧一轮 token。

适用场景

  • Agent 产品团队:token 毛利低于 30% 的团队,需要系统化降低调用成本
  • 多模型混合调用:已经在使用多个模型但缺乏统一路由方案的团队
  • 复杂工作流编排:Agent 涉及多步骤、多 Skill 组合的场景
  • 用户留存优化:希望 Agent 能记住用户偏好、减少重复指导

提示: OpenSquilla 的路由模型是本地运行的集成树模型,不需要额外调用大模型 API,本身不产生额外的 token 开销。

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
OpenSquilla 是什么四层核心机制第一层:智能路由——调对模型省对钱第二层:上下文管理——别让模型读废话第三层:MetaSkill——让 Agent 自己组织能力第四层:自进化——把用户偏好训进 Harness适用场景

相关文章

iOS 27 Siri大变身:独立App、多轮对话、灵动岛深度整合
AI产品

iOS 27 Siri大变身:独立App、多轮对话、灵动岛深度整合

iOS 27中Siri获得独立App形态,支持多轮对话和屏幕感知,Apple Intelligence深度整合灵动岛,但国行用户暂时无法使用

avatar for toolin小编
toolin小编
3小时前
微信AI开发者内测:一行代码让小程序变成AI技能
AI产品

微信AI开发者内测:一行代码让小程序变成AI技能

微信AI开放开发者接入,支持自动模式和开发模式,将小程序转化为AI可调用的Agent技能,零代码即可接入

avatar for toolin小编
toolin小编
3小时前
AI长视频生成:两大开源框架对比评测
AI产品

AI长视频生成:两大开源框架对比评测

VideoClaw和JoyAI-Echo两大开源框架同日发布,分别用多智能体协作和跨模态记忆库解决AI长视频一致性问题,本文对比两者技术方案。

avatar for toolin小编
toolin小编
1天前