腾讯混元发布并开源Hy3 Preview,总参数295B激活21B,Agent和Coding能力大幅提升,已上线元宝、WorkBuddy等平台,输入最低1.2元/百万tokens。


腾讯混元发布并开源Hy3 Preview,总参数295B激活21B,Agent和Coding能力大幅提升,已上线元宝、WorkBuddy等平台,输入最低1.2元/百万tokens。
姚顺雨入职腾讯后交出了首张答卷。混元 Hy3 Preview 是混元团队在架构、基础设施全面重建之后的第一个版本,采用快慢思考融合的 MoE 架构,总参数 295B,激活参数 21B,支持最长 256K 上下文。它的定位很明确:不追参数规模,在真实业务场景里好用。
| 参数 | 数值 |
|---|---|
| 总参数 | 295B |
| 激活参数 | 21B |
| 架构 | 快慢思考融合 MoE |
| 上下文长度 | 256K |
| 推理效率提升 | 约 40% |
官方标注的重点能力是 Agent 和 Coding,这正是姚顺雨在 OpenAI 最深耕的方向 -- Operator 和 Deep Research 背后都有他,ReAct 框架也是他提出的。
给 WorkBuddy 准备了五个格式各异、命名混乱的业务数据文件(约 100KB),让它整理成一份清晰的业务数据摘要报告。
Hy3 Preview 自己写了 Python 脚本逐一处理,txt、csv 都没卡住,最终生成的 HTML 报告有核心指标卡片、有分渠道明细表,数字全部核对无误。
要求它做一份"AI Agent 在企业办公场景落地"的深度研究报告,自己搜集资料。它把任务拆成 4 个子任务,跑了 5 轮搜索,中途又追加了一轮,最终 18 次工具调用、21 条过程消息,没有一次等人指示。报告引用了 Google Cloud、微软财报、第一新声智库等来源,覆盖了 7 个真实落地案例。
要求做一个 HTML 单文件的打字练习游戏。代码一次出来就能用,计时逻辑、WPM 计算、准确率统计全部正确,还主动做了空格显示为 . 的用户友好设计。
在 16 项基准的综合评测中,Hy3 Preview 平均得分约 56 分,显著高于上一代 Hy2(约 35 分),进入当前主流 Agent 模型的竞争区。
具体来看:
整体表现超过 GLM-5、Kimi-K2.5,接近 Gemini 3.1 Pro 与 GPT-5.4,但与 Claude Opus 4.6 仍有差距。
Hy3 Preview 已在以下平台首发上线:
其他上线产品包括 ima、CodeBuddy、QQ、QQ 浏览器、腾讯文档等。
| 项目 | 价格 |
|---|---|
| 输入(0-16K) | 1.2 元/百万 tokens |
| 输入命中缓存 | 0.4 元/百万 tokens |
| 输出(0-16K) | 4 元/百万 tokens |
| 输入(16K-256K) | 2 元/百万 tokens |
| 输出(16K-256K) | 8 元/百万 tokens |
Hy3 Preview 支持接入 OpenClaw、OpenCode、KiloCode 等开源智能体产品。
https://github.com/Tencent-Hunyuan/Hy3-preview
Hy3 Preview 的核心理念是"不追榜单,追场景"。295B 的参数量说明它不打算在模型尺寸上硬碰硬,而是通过腾讯微信、游戏、广告、企业服务等真实场景的 Co-design 来持续打磨。
姚顺雨表示这是混元大模型重建的第一步,团队正在继续扩大预训练和强化学习的规模,提升模型的智能上限。

DeepSeek-V4与GPT-5.5同一天发布,开源对闭源的正面硬刚。推理、编程、长文本实测对比,帮你快速判断该用哪个。

阶跃星辰发布新一代语音识别模型,推理速度提升 400%,支持 30 分钟音频一次性转写,定价仅为上代的 1/10

兔展智能发布UniWorld-V2.5,在中文密集文字、信息图、GUI界面生成等场景对齐GPT-Image-2,支持免费在线体验。