toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,135个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

Cohere Command A+ 开源:2180 亿参数,Apache 2.0 协议

2026/05/22
·toolin小编

Transformer 作者开源首个 Apache 2.0 旗舰模型,2180 亿参数 MoE 架构,单张 B200 可跑,支持 48 种语言和原生引用

Cohere Command A+ 开源:2180 亿参数,Apache 2.0 协议
Cohere Command A+ 开源:2180 亿参数,Apache 2.0 协议
2026/05/22

Cohere Command A+ 开源:2180 亿参数,Apache 2.0 协议

Transformer 作者开源首个 Apache 2.0 旗舰模型,2180 亿参数 MoE 架构,单张 B200 可跑,支持 48 种语言和原生引用

Command A+ 是什么为什么 Apache 2.0 协议很重要MoE + 量化:大参数不等于烧钱原生引用:把可追溯做成模型能力性能数据成本优化亮点获取方式
AI产品

Cohere 发布了 Command A+,这是首个采用 Apache 2.0 协议完全开源的旗舰级大模型。2180 亿总参数、250 亿激活参数的 MoE 架构,最低只需 1 张 NVIDIA B200 即可部署。对于想要私有化部署大模型的企业和开发者来说,这个模型值得关注。

Command A+ 是什么

Command A+ 由 Cohere(Transformer 论文作者 Aidan Gomez 创办的公司)发布,是 Command A 家族的最后一个模型,也是 Cohere 的第一个 MoE(混合专家)模型。

Command A+ 发布

关键参数一览:

项目数值
总参数2180 亿
激活参数250 亿
上下文窗口128K
支持语言48 种
最低部署1 张 B200 或 2 张 H100
许可证Apache 2.0

为什么 Apache 2.0 协议很重要

AI 圈的"开源"这个词已经被稀释了。很多公司放出权重却附带限制性条款:大企业不能商用、不能用来训练竞品模型。

Cohere 此前的 Command R / R+ 采用的是 CC-BY-NC 4.0(非商业许可)。但 Command A+ 切换到了 Apache 2.0,这是一个 OSI 认可的真正开源许可证。

这意味着:

  • 从独立开发者到世界 500 强,都可以免费使用、修改和商业化
  • 可以用内部机密数据做微调
  • 可以部署在私有服务器甚至气隙网络(air-gapped network)里
  • 不受 Cohere 的定价变动和 API 稳定性绑定

MoE + 量化:大参数不等于烧钱

Command A+ 的核心思路是两层压缩。

第一层:MoE 架构。 2180 亿参数中,每次推理只有 250 亿被激活。MoE 将问题路由给最擅长的"专家"网络,其余保持休眠。保留"巨头级"知识储备,但运行算力接近小模型。

第二层:量化。 提供 BF16、FP8 和 W4A4 三种精度版本。W4A4 是技术核心,只将 MoE 专家压到 4-bit,注意力通路保留全精度,再叠加量化感知蒸馏(Quantization-Aware Distillation)。

性能对比

Cohere 声称 W4A4 量化方案接近无损。在低并发下达到每秒 375 个 token,首 token 延迟仅 113 毫秒。

原生引用:把可追溯做成模型能力

Command A+ 做了一个原生层面的设计:当模型从外部工具检索信息时,它会生成"溯源标记"(grounding spans)。每一条事实声明都会被直接链接到具体的文档或数据库记录。

举个例子:让它出一份销售报告,它给出总销售额的同时,会明确标出提供这个数字的数据库查询结果。这种可追溯性对金融、医疗、法律等强监管行业非常重要。

多模态能力

性能数据

据 Cohere 发布的数据:

基准测试Command A ReasoningCommand A+
AIME 25 数学57%90%
Terminal-Bench Hard(智能体编码)3%25%
某电信推理测试37%85%

Command A+ 也是全多模态的,在 128K 输入上下文里原生处理文本和图像,适合分析扫描发票、图表和技术手册。

基准对比

注意:以上为 Cohere 自行发布的测试数据,并非第三方独立评测。VentureBeat 指出,在深度智能体编码和综合智能的广度上,Command A+ 仍落后于 DeepSeek 等中国头部开源模型。

成本优化亮点

  • 多语言省 token:新分词器让阿拉伯语少 20%、日语少 18%、韩语少 16%
  • 推理速度提升:W4A4 版本较前代最高提升 63%,延迟降低 17%
  • 部署门槛:过去千亿级模型要整个 GPU 集群,现在一台机器搞定

获取方式

  • 官方博客:https://cohere.com/blog/command-a-plus
  • 权重下载:HuggingFace 搜索 Command A+
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
Command A+ 是什么为什么 Apache 2.0 协议很重要MoE + 量化:大参数不等于烧钱原生引用:把可追溯做成模型能力性能数据成本优化亮点获取方式

相关文章

用寓言故事理解新概念:一个来自 Anthropic 的 Prompt 技巧
AI教程

用寓言故事理解新概念:一个来自 Anthropic 的 Prompt 技巧

Claude 性格对齐团队负责人分享的方法:让 AI 用寓言故事帮你理解任何新概念,附带优化版 Prompt 模板

avatar for toolin小编
toolin小编
1天前
OpenAI Codex 大更新:Appshots 截屏即编码、/goal 正式毕业、还能做 PPT
AI产品

OpenAI Codex 大更新:Appshots 截屏即编码、/goal 正式毕业、还能做 PPT

Codex 五大能力齐发:双击 Command 读懂全屏、/goal 长任务自主推进、Mac 锁屏也能远程干活,ChatGPT 同时杀入 PowerPoint

avatar for toolin小编
toolin小编
1天前
用Agent跑通4个高频办公场景的实操方法
AI教程

用Agent跑通4个高频办公场景的实操方法

从爆款文章拆解到出差行程规划,从知识管理到短视频制作,用bit-Agent的「探索-固化」模式零代码搭建自动化工作流。

avatar for toolin小编
toolin小编
2天前