小米MiMo-V2.5系列API最高降价99%,Token Plan套餐容量提升5-8倍,全面对标DeepSeek价格


小米MiMo-V2.5系列API最高降价99%,Token Plan套餐容量提升5-8倍,全面对标DeepSeek价格
5月27日,小米宣布 MiMo-V2.5 系列 API 永久降价,最高降幅 99%,同时 Token Plan 套餐容量提升 5-8 倍。这是继 DeepSeek 之后又一家选择"永久降价"的大模型厂商,两个国产模型的价格几乎直接对标。
本次调价覆盖 MiMo-V2.5 和 MiMo-V2.5-Pro 两个版本,新价格已于北京时间 5 月 27 日 0 点全球同步生效。最关键的变化:不再区分上下文窗口长度,256K 和 1M 统一同一价格。
| 计费项 | MiMo-V2.5 | MiMo-V2.5-Pro | DeepSeek-V4-Pro |
|---|---|---|---|
| 输入(缓存命中) | 0.02 元/百万 tokens | 0.025 元/百万 tokens | 0.025 元/百万 tokens |
| 输入(缓存未命中) | 1 元/百万 tokens | 3 元/百万 tokens | 3 元/百万 tokens |
| 输出 | 2 元/百万 tokens | 6 元/百万 tokens | 6 元/百万 tokens |
💡 提示: 99% 的降幅主要体现在"缓存命中"场景。高重复上下文、高频 Agent、多轮代码任务和批量推理任务最能吃到低价红利。缓存命中率低的应用,实际成本不会触及最低点。
定价不变,Credits 大幅提升:
| 套餐 | 月费 | 原 Credits | 新 Credits | 提升倍数 |
|---|---|---|---|---|
| Lite | 39 元 | 0.6 亿 | 41 亿 | ~68x |
| Standard | 99 元 | 2 亿 | 110 亿 | ~55x |
| Pro | 329 元 | 7 亿 | 380 亿 | ~54x |
| Max | 659 元 | 16 亿 | 820 亿 | ~51x |
按 95% 以上缓存命中场景测算,39 元的 Lite 套餐用 MiMo-V2.5 可以跑到 5 亿 Token 以上;659 元的 Max 套餐突破 100 亿 Token。即使在更贵的 MiMo-V2.5-Pro 上,Lite 套餐也能达到 1.9 亿 Token 以上。
所有仍在有效期内的 Token Plan 用户,Credits 已于 5 月 27 日 0 点全部重置,自动切换至新计费规则。
小米公告解释了背后的推理优化方案:
价格战背后,本质是推理系统与基础设施能力的竞争。
| 模型 | 定位 | 适用场景 |
|---|---|---|
| MiMo-V2.5-Pro | 高性能复杂推理 | 企业级智能体开发、深度业务分析 |
| MiMo-V2.5 | 轻量化通用 | 中小开发者日常调用、轻量化应用 |
| MiMo-V2.5-TTS | 语音合成 | 音频生态(限时免费接入) |
MiMo-V2.5-Pro 在 Artificial Analysis 综合智能榜位列全球开源模型并列第一,Agent 指数同样位列全球开源模型并列第一。已以 MIT 协议开源,支持商用部署与二次训练。