toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,163个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

小米MiMo API永久降价99%,开发者怎么薅

2026/05/28
·toolin小编

小米MiMo-V2.5系列API最高降价99%,Token Plan套餐容量提升5-8倍,全面对标DeepSeek价格

小米MiMo API永久降价99%,开发者怎么薅
小米MiMo API永久降价99%,开发者怎么薅
2026/05/28

小米MiMo API永久降价99%,开发者怎么薅

小米MiMo-V2.5系列API最高降价99%,Token Plan套餐容量提升5-8倍,全面对标DeepSeek价格

降价细节API 价格对比Token Plan 套餐变化为什么能降价MiMo-V2.5 系列模型定位对开发者意味着什么怎么用上
AI产品

5月27日,小米宣布 MiMo-V2.5 系列 API 永久降价,最高降幅 99%,同时 Token Plan 套餐容量提升 5-8 倍。这是继 DeepSeek 之后又一家选择"永久降价"的大模型厂商,两个国产模型的价格几乎直接对标。

降价细节

本次调价覆盖 MiMo-V2.5 和 MiMo-V2.5-Pro 两个版本,新价格已于北京时间 5 月 27 日 0 点全球同步生效。最关键的变化:不再区分上下文窗口长度,256K 和 1M 统一同一价格。

API 价格对比

计费项MiMo-V2.5MiMo-V2.5-ProDeepSeek-V4-Pro
输入(缓存命中)0.02 元/百万 tokens0.025 元/百万 tokens0.025 元/百万 tokens
输入(缓存未命中)1 元/百万 tokens3 元/百万 tokens3 元/百万 tokens
输出2 元/百万 tokens6 元/百万 tokens6 元/百万 tokens

💡 提示: 99% 的降幅主要体现在"缓存命中"场景。高重复上下文、高频 Agent、多轮代码任务和批量推理任务最能吃到低价红利。缓存命中率低的应用,实际成本不会触及最低点。

Token Plan 套餐变化

定价不变,Credits 大幅提升:

套餐月费原 Credits新 Credits提升倍数
Lite39 元0.6 亿41 亿~68x
Standard99 元2 亿110 亿~55x
Pro329 元7 亿380 亿~54x
Max659 元16 亿820 亿~51x

按 95% 以上缓存命中场景测算,39 元的 Lite 套餐用 MiMo-V2.5 可以跑到 5 亿 Token 以上;659 元的 Max 套餐突破 100 亿 Token。即使在更贵的 MiMo-V2.5-Pro 上,Lite 套餐也能达到 1.9 亿 Token 以上。

所有仍在有效期内的 Token Plan 用户,Credits 已于 5 月 27 日 0 点全部重置,自动切换至新计费规则。

为什么能降价

小米公告解释了背后的推理优化方案:

  • 基于 SGLang HiCache 完整支持 SWA(滑动窗口注意力),将 KV Cache 在 GPU 显存、CPU 内存、SSD 间的数据搬运量降至优化前的约 1/7
  • 可缓存 Token 数量提升至约 5 倍
  • 优化了专家并行方案和输入长度分桶策略,提升集群输入吞吐能力

价格战背后,本质是推理系统与基础设施能力的竞争。

MiMo-V2.5 系列模型定位

模型定位适用场景
MiMo-V2.5-Pro高性能复杂推理企业级智能体开发、深度业务分析
MiMo-V2.5轻量化通用中小开发者日常调用、轻量化应用
MiMo-V2.5-TTS语音合成音频生态(限时免费接入)

MiMo-V2.5-Pro 在 Artificial Analysis 综合智能榜位列全球开源模型并列第一,Agent 指数同样位列全球开源模型并列第一。已以 MIT 协议开源,支持商用部署与二次训练。

对开发者意味着什么

  1. Agent 和代码助手成本骤降:Agent 场景下缓存命中率高,MiMo 的低价策略天然适合高频多轮任务
  2. 与 DeepSeek 价格基本持平:两个国产模型形成了价格锚点,开发者可以根据模型能力灵活切换
  3. 海外用户同样受益:价格全球同步,海外社区反馈积极——"MiMo 比 Opus 低 3 分,价格便宜百倍以上"

怎么用上

  • API 调用:访问小米开放平台获取 API Key,按新价格直接调用
  • Token Plan:39 元起,适合有稳定用量需求的开发者
  • 开源部署:MiMo-V2.5 系列以 MIT 协议开源,可自行部署
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
降价细节API 价格对比Token Plan 套餐变化为什么能降价MiMo-V2.5 系列模型定位对开发者意味着什么怎么用上

相关文章

skill-cleaner: 开源工具给你的Agent技能减肥
AI教程

skill-cleaner: 开源工具给你的Agent技能减肥

龙虾之父Peter开源skill-cleaner,5大核心功能审计优化Agent技能描述,节省Token成本,提升Agent调用准确性,GitHub已开源。

avatar for toolin小编
toolin小编
1天前
火山引擎AI Trust:三层架构守护Agent安全
AI产品

火山引擎AI Trust:三层架构守护Agent安全

火山引擎发布AI Trust安全产品体系,覆盖模型可信、智能体可控、智能化安全运营,日检测调用量达100亿次

avatar for toolin小编
toolin小编
12小时前
星尘智能T1:8.99万元的人形机器人开卖
AI产品

星尘智能T1:8.99万元的人形机器人开卖

星尘智能发布T1人形机器人,8.99万元起,绳驱本体+自研AI模型+具身OS三位一体架构,6月1日起发货

avatar for toolin小编
toolin小编
12小时前