专为DeepSeek打造的终端coding harness,基于prefix-cache设计将缓存命中率达99.82%,输入token成本降至1/5。


专为DeepSeek打造的终端coding harness,基于prefix-cache设计将缓存命中率达99.82%,输入token成本降至1/5。
如果你在用 DeepSeek V4 的 API 做编程任务,长会话的 token 消耗可能让你肉疼。一个开源项目 Reasonix 专门为 DeepSeek 打造了缓存优化方案,把缓存命中率做到 99.82%,原本 61 美元的账单直降至 12 美元,相当于打了2折。
本文介绍 Reasonix 的工作原理和使用方法。
Reasonix 是一款专为 DeepSeek 打造的终端 coding harness(编程代理工具)。它的核心目的就两个字:省钱。
具体来说,它通过优化缓存命中率,将长会话的输入 token 成本降到原来的 1/5。

Reasonix 的关键设计是基于字节稳定 prefix-cache 的 append-only 运行循环。
DeepSeek 的自动前缀缓存(prefix-cache)只在当前请求的精确字节前缀和先前请求匹配时才会激活。大多数 Agent 循环会在每次交互时重新排序、重写或注入新的时间戳,导致缓存失效。
Reasonix 把上下文划分为三个区域:

这种设计让前缀固定、历史只追加、草稿可修改,三区各司其职,最大化缓存命中。
DeepSeek 在工具调用方面有几个常见问题:
Reasonix 通过4轮自动修复处理这些问题,在真正执行前先尝试修复,避免无效请求浪费 token。
Reasonix 有三层成本控制机制:
1. 默认使用便宜模型
默认优先使用 v4 flash,只有困难任务才切 pro。
2. 自动上下文压缩
轮次结束后自动压缩上下文,减少后续请求的 token 数。
3. 失败自动升级
用户可以手动输入 /pro 让下一轮切换为 v4 pro。跑完这一轮后 Reasonix 自动切回便宜模型。如果失败次数到达警戒线,当前轮次的剩余部分也会自动切到 v4 pro。
两步即可运行,无需全局安装:
# 1. 进入项目目录
cd your-project
# 2. 启动 Reasonix
npx reasonix code启动后会打开 TUI(终端用户界面),直接开始使用。首次运行会自动配置 DeepSeek API 密钥。
提示:确保你的 DeepSeek API 密钥已配置在环境变量中,或者按照提示输入。
根据 Reasonix 的测试数据:
| 指标 | 效果 |
|---|---|
| 缓存命中率 | 最高 99.82% |
| 输入 token 成本 | 降至 1/5 |
| 长会话缓存命中率 | 稳定 90%+ |
| 典型账单(4亿+ token) | 61美元 -> 12美元 |

Anthropic和OpenAI同时验证的结论:AI编程智能体失败的原因不在模型,在Harness。五步搭建你的第一个Harness配置

OpenAI员工亲授Codex自我蒸馏提示词,自动识别重复工作流并打包为Skill、Subagent或Automation。

GitHub 15万星的Claude Code配置神器,内置38个专业智能体、156项技能、1282项安全测试,MIT协议完全开源