MiniMax M3 发布：Coding能力对标Opus，1M上下文+原生多模态

MiniMax M3 今日正式发布。这款模型在编程和 Agent 任务上达到前沿水平，搭载全新稀疏注意力架构 MSA（MiniMax Sparse Attention），最高支持 1M 超长上下文，同时是原生多模态模型，支持图片和视频输入并能操作电脑桌面。

M3 是国内第一个同时具备前沿 Coding 能力、超长上下文和原生多模态这三大要素的模型。

MiniMax M3 性能对比

MiniMax M3 在多个基准测试中的表现

核心能力一览

Coding 和 Agent 能力

在衡量 Coding 能力的国际权威评测中，M3 达到国际领先水平：

SWE-Bench Pro: 59.0%（超过 GPT-5.5 和 Gemini 3.1 Pro，接近 Opus 4.7）
Terminal Bench 2.1: 66.0%
SWE-fficiency: 34.8%
KernelBench Hard: 28.8%
MCP Atlas: 74.2%
SVG-Bench: 超过 Opus 4.7

M3 在 Agent 端到端评测框架 Claw-Eval 上也得到最高分。

全新注意力架构 MSA

MSA 是 MiniMax 自研的稀疏注意力架构，解决了全注意力机制计算复杂度平方级增长的问题。它的核心优势：

精准 KV 分块：比 DSA 和 MoBA 更精确，实现更高的有效上下文覆盖
计算访存优化：采用 KV outer gather Q 方式，每块只读一次、访存连续
显著加速：比开源的 Flash-Sparse-Attention、FlashMoBA 快 4 倍以上

MSA 架构对比

MSA 与其他稀疏注意力方案的速度对比

在 100 万上下文下，M3 每 token 计算量仅为上代模型的 1/20。Prefilling 阶段加速超过 9 倍，Decoding 阶段加速超过 15 倍。

原生多模态

M3 从 Step 0 开始进行多模态混合训练，不是后接视觉编码器，而是让不同模态数据的语义空间天然融合。训练数据中的 Interleaved data（交错数据）对性能提升尤为关键，训练 Token 规模已提升至 100 万亿量级。

实测：12小时无人干预复现获奖论文

MiniMax 团队给 M3 丢了一篇 ICLR 2025 Outstanding Paper Award 获奖论文——Learning Dynamics of LLM Finetuning，让它独立复现。

M3 自主运行了接近 12 小时，全程无人干预，最终：

产出 18 次 commit 与 23 张实验图表
成功吻合 SFT 阶段的预测概率变化趋势
清晰观测到 DPO 实验中的 squeezing 效应
验证了原论文提出的 Extend 缓解方法

这个测试同时调动了 M3 的三大能力：1M 超长上下文（读完整篇论文）、顶级编程能力（写实验代码）、原生多模态（生成和解读实验图表）。

如何体验

你可以在以下平台第一时间体验 MiniMax M3：

MiniMax Code：在线编程环境
Token Plan：API 调用服务
MiniMax API：直接接入你的项目

交互式用户模拟器框架

M3 在 Coding 能力上的提升不仅靠 Benchmark 训练。MiniMax 构建了交互式用户模拟器框架，模拟真实开发者在协作过程中的行为模式：

需求补充与方案讨论
反馈修正与连续任务切换
复杂项目的多轮迭代优化

这让 Agent 不再只是被动执行指令，而是能够主动与用户协同完成任务。下一代 Agent Coding 比的不仅是代码生成，更是长期协作能力和人与 Agent 的协同效率。

适合谁用

开发者：需要强 Coding 能力的 Agent 来处理复杂的软件工程任务
研究人员：需要处理超长文档（论文、代码库）并进行复杂推理
Agent 构建者：需要一个能同时理解文本、图像、视频并操作电脑的基座模型
企业用户：需要处理长上下文的企业知识库和文档分析场景

M3 是国内第一个同时具备前沿 Coding 能力、超长上下文和原生多模态这三大要素的模型。

MiniMax M3 性能对比

MiniMax M3 在多个基准测试中的表现

核心能力一览

Coding 和 Agent 能力

在衡量 Coding 能力的国际权威评测中，M3 达到国际领先水平：

SWE-Bench Pro: 59.0%（超过 GPT-5.5 和 Gemini 3.1 Pro，接近 Opus 4.7）
Terminal Bench 2.1: 66.0%
SWE-fficiency: 34.8%
KernelBench Hard: 28.8%
MCP Atlas: 74.2%
SVG-Bench: 超过 Opus 4.7

M3 在 Agent 端到端评测框架 Claw-Eval 上也得到最高分。

全新注意力架构 MSA

MSA 是 MiniMax 自研的稀疏注意力架构，解决了全注意力机制计算复杂度平方级增长的问题。它的核心优势：

精准 KV 分块：比 DSA 和 MoBA 更精确，实现更高的有效上下文覆盖
计算访存优化：采用 KV outer gather Q 方式，每块只读一次、访存连续
显著加速：比开源的 Flash-Sparse-Attention、FlashMoBA 快 4 倍以上

MSA 架构对比

MSA 与其他稀疏注意力方案的速度对比

在 100 万上下文下，M3 每 token 计算量仅为上代模型的 1/20。Prefilling 阶段加速超过 9 倍，Decoding 阶段加速超过 15 倍。

原生多模态

实测：12小时无人干预复现获奖论文

MiniMax 团队给 M3 丢了一篇 ICLR 2025 Outstanding Paper Award 获奖论文——Learning Dynamics of LLM Finetuning，让它独立复现。

M3 自主运行了接近 12 小时，全程无人干预，最终：

产出 18 次 commit 与 23 张实验图表
成功吻合 SFT 阶段的预测概率变化趋势
清晰观测到 DPO 实验中的 squeezing 效应
验证了原论文提出的 Extend 缓解方法

这个测试同时调动了 M3 的三大能力：1M 超长上下文（读完整篇论文）、顶级编程能力（写实验代码）、原生多模态（生成和解读实验图表）。

如何体验

你可以在以下平台第一时间体验 MiniMax M3：

MiniMax Code：在线编程环境
Token Plan：API 调用服务
MiniMax API：直接接入你的项目

交互式用户模拟器框架

M3 在 Coding 能力上的提升不仅靠 Benchmark 训练。MiniMax 构建了交互式用户模拟器框架，模拟真实开发者在协作过程中的行为模式：

需求补充与方案讨论
反馈修正与连续任务切换
复杂项目的多轮迭代优化

适合谁用

开发者：需要强 Coding 能力的 Agent 来处理复杂的软件工程任务
研究人员：需要处理超长文档（论文、代码库）并进行复杂推理
Agent 构建者：需要一个能同时理解文本、图像、视频并操作电脑的基座模型
企业用户：需要处理长上下文的企业知识库和文档分析场景

全部

AI教程

AI产品

AI资源

MiniMax M3 发布：Coding能力对标Opus，1M上下文+原生多模态

MiniMax M3 发布：Coding能力对标Opus，1M上下文+原生多模态

核心能力一览

Coding 和 Agent 能力

全新注意力架构 MSA

原生多模态

实测：12小时无人干预复现获奖论文

如何体验

交互式用户模拟器框架

适合谁用

作者

分类

相关文章

Diffusion Templates：像搭积木一样控制图像生成

OpenCLI：把全网变成命令行的开源神器

Codex免费两个月 vs Claude Code额度翻倍，AI编程工具怎么选

MiniMax M3 发布：Coding能力对标Opus，1M上下文+原生多模态

MiniMax M3 发布：Coding能力对标Opus，1M上下文+原生多模态

核心能力一览

Coding 和 Agent 能力

全新注意力架构 MSA

原生多模态

实测：12小时无人干预复现获奖论文

如何体验

交互式用户模拟器框架

适合谁用

作者

分类

相关文章

Diffusion Templates：像搭积木一样控制图像生成

OpenCLI：把全网变成命令行的开源神器

Codex免费两个月 vs Claude Code额度翻倍，AI编程工具怎么选