OpenRouter的Fusion多模型融合方案,通过Kimi K2.6+DeepSeek V4 Pro+Gemini 3 Flash组合,在DRACO基准上性能追平Fable 5,成本仅为其50%


OpenRouter的Fusion多模型融合方案,通过Kimi K2.6+DeepSeek V4 Pro+Gemini 3 Flash组合,在DRACO基准上性能追平Fable 5,成本仅为其50%
Fable 5 的下架让很多开发者措手不及,但 OpenRouter 提供了一个替代方案:Fusion 多模型融合。通过将多个大模型组队协作,一套平价模型阵容就能实现接近 Fable 5 的综合能力,而成本只有一半。本文带你了解 Fusion 的工作原理和具体使用方法。
Fusion 是 OpenRouter 推出的多模型融合方案。当你向 Fusion 发送指令后,系统会:
整套流程在服务端完成,调用体验和使用单个模型基本一致。

任务并行分发到多个模型,再由判定模型整合分析后输出最终答案。
在 Perplexity AI 打造的 DRACO 深度研究基准测试集上(100 道实战题,覆盖学术、金融、法律、医疗、技术等十大领域),测试结果显示:
| 模型/组合 | DRACO 得分 |
|---|---|
| Opus 4.8 + GPT-5.5 | 69.0%(最高) |
| Claude Fable 5(单独) | 65.3% |
| Kimi K2.6 + DeepSeek V4 Pro + Gemini 3 Flash | 64.7% |
平价组合与 Fable 5 仅差 0.6 个百分点,性能基本持平。

Kimi K2.6+DeepSeek V4 Pro+Gemini 3 Flash组合得分64.7%,几乎追平Fable 5的65.3%。
| 模型 | 输入 ($/M tokens) | 输出 ($/M tokens) |
|---|---|---|
| DeepSeek V4 Pro | 0.44 | 0.87 |
| Gemini 3 Flash | 约 0.5 | 约 3 |
| Kimi K2.6(首次) | 0.95 | 4 |
| Kimi K2.6(缓存) | 0.16 | 4 |
三者组合后,综合调用成本相比 Fable 5 降幅接近 80%。算上平台调度、内容融合等附加成本,单任务总花费依旧只有 Fable 5 的约 50%。

三人组单任务总花费依旧低于Fable 5,是全场性价比最优方案。
OpenRouter 网页端提供预设组合一键启用,也可以按需自由搭配模型。

在网页端直接选择预设组合或自由搭配。
通过 API 接口自动化调用,在参数里指定模型组合即可。

在API参数中指定模型组合即可完成调用。
测试中一个有趣的发现:即使是同一模型进行自我融合(同一指令多次运行后整合),也能实现性能提升。例如 Opus 4.8 自身组合后,得分从单体 58.8% 提升至 65.5%。
这说明 Fusion 的性能增益不仅来自不同模型的能力互补,答案整合和逻辑梳理这一流程本身就能优化输出质量。

Codex 新增自生成目标功能,人类只需给出意图,AI 自动拆解任务并调度子 Agent 执行

用一句意图让 Codex 自主拆解任务、派生子智能体、18小时完成14个功能开发,附配置教程与避坑指南

蚂蚁集团ACL 2026新作FuseSearch-4B,通过自适应并行搜索策略,在代码定位任务上匹配Claude Haiku 4.5,速度快93.6%,Token省68.9%