toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,194个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

MiniMax M3 发布:Coding能力对标Opus,1M上下文+原生多模态

2026/06/01
·toolin小编

MiniMax M3 搭载全新稀疏注意力架构MSA,支持1M上下文窗口,Coding能力超过GPT-5.5,国内首个齐备前沿三大能力的模型

MiniMax M3 发布:Coding能力对标Opus,1M上下文+原生多模态
MiniMax M3 发布:Coding能力对标Opus,1M上下文+原生多模态
2026/06/01

MiniMax M3 发布:Coding能力对标Opus,1M上下文+原生多模态

MiniMax M3 搭载全新稀疏注意力架构MSA,支持1M上下文窗口,Coding能力超过GPT-5.5,国内首个齐备前沿三大能力的模型

核心能力一览Coding 和 Agent 能力全新注意力架构 MSA原生多模态实测:12小时无人干预复现获奖论文如何体验交互式用户模拟器框架适合谁用
AI产品

MiniMax M3 今日正式发布。这款模型在编程和 Agent 任务上达到前沿水平,搭载全新稀疏注意力架构 MSA(MiniMax Sparse Attention),最高支持 1M 超长上下文,同时是原生多模态模型,支持图片和视频输入并能操作电脑桌面。

M3 是国内第一个同时具备前沿 Coding 能力、超长上下文和原生多模态这三大要素的模型。

MiniMax M3 性能对比

MiniMax M3 在多个基准测试中的表现

核心能力一览

Coding 和 Agent 能力

在衡量 Coding 能力的国际权威评测中,M3 达到国际领先水平:

  • SWE-Bench Pro: 59.0%(超过 GPT-5.5 和 Gemini 3.1 Pro,接近 Opus 4.7)
  • Terminal Bench 2.1: 66.0%
  • SWE-fficiency: 34.8%
  • KernelBench Hard: 28.8%
  • MCP Atlas: 74.2%
  • SVG-Bench: 超过 Opus 4.7

M3 在 Agent 端到端评测框架 Claw-Eval 上也得到最高分。

全新注意力架构 MSA

MSA 是 MiniMax 自研的稀疏注意力架构,解决了全注意力机制计算复杂度平方级增长的问题。它的核心优势:

  • 精准 KV 分块:比 DSA 和 MoBA 更精确,实现更高的有效上下文覆盖
  • 计算访存优化:采用 KV outer gather Q 方式,每块只读一次、访存连续
  • 显著加速:比开源的 Flash-Sparse-Attention、FlashMoBA 快 4 倍以上

MSA 架构对比

MSA 与其他稀疏注意力方案的速度对比

在 100 万上下文下,M3 每 token 计算量仅为上代模型的 1/20。Prefilling 阶段加速超过 9 倍,Decoding 阶段加速超过 15 倍。

原生多模态

M3 从 Step 0 开始进行多模态混合训练,不是后接视觉编码器,而是让不同模态数据的语义空间天然融合。训练数据中的 Interleaved data(交错数据)对性能提升尤为关键,训练 Token 规模已提升至 100 万亿量级。

实测:12小时无人干预复现获奖论文

MiniMax 团队给 M3 丢了一篇 ICLR 2025 Outstanding Paper Award 获奖论文——Learning Dynamics of LLM Finetuning,让它独立复现。

M3 自主运行了接近 12 小时,全程无人干预,最终:

  • 产出 18 次 commit 与 23 张实验图表
  • 成功吻合 SFT 阶段的预测概率变化趋势
  • 清晰观测到 DPO 实验中的 squeezing 效应
  • 验证了原论文提出的 Extend 缓解方法

这个测试同时调动了 M3 的三大能力:1M 超长上下文(读完整篇论文)、顶级编程能力(写实验代码)、原生多模态(生成和解读实验图表)。

如何体验

你可以在以下平台第一时间体验 MiniMax M3:

  • MiniMax Code:在线编程环境
  • Token Plan:API 调用服务
  • MiniMax API:直接接入你的项目

交互式用户模拟器框架

M3 在 Coding 能力上的提升不仅靠 Benchmark 训练。MiniMax 构建了交互式用户模拟器框架,模拟真实开发者在协作过程中的行为模式:

  • 需求补充与方案讨论
  • 反馈修正与连续任务切换
  • 复杂项目的多轮迭代优化

这让 Agent 不再只是被动执行指令,而是能够主动与用户协同完成任务。下一代 Agent Coding 比的不仅是代码生成,更是长期协作能力和人与 Agent 的协同效率。

适合谁用

  • 开发者:需要强 Coding 能力的 Agent 来处理复杂的软件工程任务
  • 研究人员:需要处理超长文档(论文、代码库)并进行复杂推理
  • Agent 构建者:需要一个能同时理解文本、图像、视频并操作电脑的基座模型
  • 企业用户:需要处理长上下文的企业知识库和文档分析场景
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
核心能力一览Coding 和 Agent 能力全新注意力架构 MSA原生多模态实测:12小时无人干预复现获奖论文如何体验交互式用户模拟器框架适合谁用

相关文章

Gamma-World:开源多智能体世界模型
AI产品

Gamma-World:开源多智能体世界模型

NVIDIA联合清华开源多智能体世界模型,双人训练直接泛化到四人,支持零样本多人场景实时推演

avatar for toolin小编
toolin小编
2天前
NVIDIA RTX Spark:英伟达重新定义AI PC,128G统一内存本地跑120B模型
AI产品

NVIDIA RTX Spark:英伟达重新定义AI PC,128G统一内存本地跑120B模型

英伟达发布RTX Spark消费级AI芯片,128GB统一内存、1 PFLOP算力,可在14mm笔记本上本地运行120B大模型,Windows生态迎来AI PC时代

avatar for toolin小编
toolin小编
1天前
Syll:清华开源多模态全交互智能体框架
AI产品

Syll:清华开源多模态全交互智能体框架

支持GUI、CLI、MCP三种操作方式,通过示教自动生成可复用技能,本地部署保护数据隐私

avatar for toolin小编
toolin小编
2天前