腾讯混元Hy3 Preview：姚顺雨首秀，295B参数聚焦Agent和编程

姚顺雨入职腾讯后交出了首张答卷。混元 Hy3 Preview 是混元团队在架构、基础设施全面重建之后的第一个版本，采用快慢思考融合的 MoE 架构，总参数 295B，激活参数 21B，支持最长 256K 上下文。它的定位很明确：不追参数规模，在真实业务场景里好用。

核心参数

参数	数值
总参数	295B
激活参数	21B
架构	快慢思考融合 MoE
上下文长度	256K
推理效率提升	约 40%

官方标注的重点能力是 Agent 和 Coding，这正是姚顺雨在 OpenAI 最深耕的方向 -- Operator 和 Deep Research 背后都有他，ReAct 框架也是他提出的。

Agent 能力：实测三大任务

任务一：本地文件处理 + HTML 报告生成

给 WorkBuddy 准备了五个格式各异、命名混乱的业务数据文件（约 100KB），让它整理成一份清晰的业务数据摘要报告。

Hy3 Preview 自己写了 Python 脚本逐一处理，txt、csv 都没卡住，最终生成的 HTML 报告有核心指标卡片、有分渠道明细表，数字全部核对无误。

任务二：深度研究报告

要求它做一份"AI Agent 在企业办公场景落地"的深度研究报告，自己搜集资料。它把任务拆成 4 个子任务，跑了 5 轮搜索，中途又追加了一轮，最终 18 次工具调用、21 条过程消息，没有一次等人指示。报告引用了 Google Cloud、微软财报、第一新声智库等来源，覆盖了 7 个真实落地案例。

任务三：打字练习游戏

要求做一个 HTML 单文件的打字练习游戏。代码一次出来就能用，计时逻辑、WPM 计算、准确率统计全部正确，还主动做了空格显示为 . 的用户友好设计。

性能表现

在 16 项基准的综合评测中，Hy3 Preview 平均得分约 56 分，显著高于上一代 Hy2（约 35 分），进入当前主流 Agent 模型的竞争区。

整体表现超过 GLM-5、Kimi-K2.5，接近 Gemini 3.1 Pro 与 GPT-5.4，但与 Claude Opus 4.6 仍有差距。

怎么用

直接体验

其他上线产品包括 ima、CodeBuddy、QQ、QQ 浏览器、腾讯文档等。

API 价格

项目	价格
输入（0-16K）	1.2 元/百万 tokens
输入命中缓存	0.4 元/百万 tokens
输出（0-16K）	4 元/百万 tokens
输入（16K-256K）	2 元/百万 tokens
输出（16K-256K）	8 元/百万 tokens

接入第三方工具

Hy3 Preview 支持接入 OpenClaw、OpenCode、KiloCode 等开源智能体产品。

开源地址

定位与展望

Hy3 Preview 的核心理念是"不追榜单，追场景"。295B 的参数量说明它不打算在模型尺寸上硬碰硬，而是通过腾讯微信、游戏、广告、企业服务等真实场景的 Co-design 来持续打磨。

姚顺雨表示这是混元大模型重建的第一步，团队正在继续扩大预训练和强化学习的规模，提升模型的智能上限。

全部

AI教程

AI产品

AI资源

腾讯混元Hy3 Preview：姚顺雨首秀，295B参数聚焦Agent和编程

腾讯混元Hy3 Preview：姚顺雨首秀，295B参数聚焦Agent和编程

作者

分类

相关文章

Codex 5.5 + GPT-5.5：OpenAI编程工具大升级

腾讯混元Hy3 Preview：姚顺雨首秀，295B参数聚焦Agent和编程

腾讯混元Hy3 Preview：姚顺雨首秀，295B参数聚焦Agent和编程

作者

分类

相关文章

Codex 5.5 + GPT-5.5：OpenAI编程工具大升级

DeepSeek-TUI：终端里的AI编程Agent

GPT-image-2 生图转PSD实操指南

核心参数

Agent 能力：实测三大任务

任务一：本地文件处理 + HTML 报告生成

任务二：深度研究报告

任务三：打字练习游戏

性能表现

怎么用

直接体验

API 价格

接入第三方工具

开源地址

定位与展望