toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具992个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

腾讯混元Hy3 Preview:姚顺雨首秀,295B参数聚焦Agent和编程

2026/04/23
·toolin小编

腾讯混元发布并开源Hy3 Preview,总参数295B激活21B,Agent和Coding能力大幅提升,已上线元宝、WorkBuddy等平台,输入最低1.2元/百万tokens。

腾讯混元Hy3 Preview:姚顺雨首秀,295B参数聚焦Agent和编程
腾讯混元Hy3 Preview:姚顺雨首秀,295B参数聚焦Agent和编程
2026/04/23

腾讯混元Hy3 Preview:姚顺雨首秀,295B参数聚焦Agent和编程

腾讯混元发布并开源Hy3 Preview,总参数295B激活21B,Agent和Coding能力大幅提升,已上线元宝、WorkBuddy等平台,输入最低1.2元/百万tokens。

核心参数Agent 能力:实测三大任务任务一:本地文件处理 + HTML 报告生成任务二:深度研究报告任务三:打字练习游戏性能表现怎么用直接体验API 价格接入第三方工具开源地址定位与展望
AI产品

姚顺雨入职腾讯后交出了首张答卷。混元 Hy3 Preview 是混元团队在架构、基础设施全面重建之后的第一个版本,采用快慢思考融合的 MoE 架构,总参数 295B,激活参数 21B,支持最长 256K 上下文。它的定位很明确:不追参数规模,在真实业务场景里好用。

核心参数

参数数值
总参数295B
激活参数21B
架构快慢思考融合 MoE
上下文长度256K
推理效率提升约 40%

官方标注的重点能力是 Agent 和 Coding,这正是姚顺雨在 OpenAI 最深耕的方向 -- Operator 和 Deep Research 背后都有他,ReAct 框架也是他提出的。

Agent 能力:实测三大任务

任务一:本地文件处理 + HTML 报告生成

给 WorkBuddy 准备了五个格式各异、命名混乱的业务数据文件(约 100KB),让它整理成一份清晰的业务数据摘要报告。

Hy3 Preview 自己写了 Python 脚本逐一处理,txt、csv 都没卡住,最终生成的 HTML 报告有核心指标卡片、有分渠道明细表,数字全部核对无误。

任务二:深度研究报告

要求它做一份"AI Agent 在企业办公场景落地"的深度研究报告,自己搜集资料。它把任务拆成 4 个子任务,跑了 5 轮搜索,中途又追加了一轮,最终 18 次工具调用、21 条过程消息,没有一次等人指示。报告引用了 Google Cloud、微软财报、第一新声智库等来源,覆盖了 7 个真实落地案例。

任务三:打字练习游戏

要求做一个 HTML 单文件的打字练习游戏。代码一次出来就能用,计时逻辑、WPM 计算、准确率统计全部正确,还主动做了空格显示为 . 的用户友好设计。

性能表现

在 16 项基准的综合评测中,Hy3 Preview 平均得分约 56 分,显著高于上一代 Hy2(约 35 分),进入当前主流 Agent 模型的竞争区。

具体来看:

  • 复杂推理:FrontierScience-Olympiad 70.0 分,IMO Answer Bench 84.3 分,清华求真书院数学博士资格考试 88.4 分(国内最高)
  • 代码能力:SWE-Bench Verified 74.4%,Terminal-Bench 2.0 54.4%
  • 搜索能力:BrowseComp 67.1%,WideSearch 70.2%

整体表现超过 GLM-5、Kimi-K2.5,接近 Gemini 3.1 Pro 与 GPT-5.4,但与 Claude Opus 4.6 仍有差距。

怎么用

直接体验

Hy3 Preview 已在以下平台首发上线:

  • 元宝 App:在对话界面选择 Hy3 Preview 模型即可
  • WorkBuddy:本地安装使用,能直接操作电脑文件和终端
  • 腾讯云 TokenHub:API 调用

其他上线产品包括 ima、CodeBuddy、QQ、QQ 浏览器、腾讯文档等。

API 价格

项目价格
输入(0-16K)1.2 元/百万 tokens
输入命中缓存0.4 元/百万 tokens
输出(0-16K)4 元/百万 tokens
输入(16K-256K)2 元/百万 tokens
输出(16K-256K)8 元/百万 tokens

接入第三方工具

Hy3 Preview 支持接入 OpenClaw、OpenCode、KiloCode 等开源智能体产品。

开源地址

https://github.com/Tencent-Hunyuan/Hy3-preview

定位与展望

Hy3 Preview 的核心理念是"不追榜单,追场景"。295B 的参数量说明它不打算在模型尺寸上硬碰硬,而是通过腾讯微信、游戏、广告、企业服务等真实场景的 Co-design 来持续打磨。

姚顺雨表示这是混元大模型重建的第一步,团队正在继续扩大预训练和强化学习的规模,提升模型的智能上限。

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
核心参数Agent 能力:实测三大任务任务一:本地文件处理 + HTML 报告生成任务二:深度研究报告任务三:打字练习游戏性能表现怎么用直接体验API 价格接入第三方工具开源地址定位与展望

相关文章

DeepSeek-V4与GPT-5.5实测:同日发布的两大模型谁更强
AI产品

DeepSeek-V4与GPT-5.5实测:同日发布的两大模型谁更强

DeepSeek-V4与GPT-5.5同一天发布,开源对闭源的正面硬刚。推理、编程、长文本实测对比,帮你快速判断该用哪个。

avatar for toolin小编
toolin小编
1天前
StepAudio 2.5 ASR:5 分钟音频 2 秒转写,定价降至 0.15 元/小时
AI产品

StepAudio 2.5 ASR:5 分钟音频 2 秒转写,定价降至 0.15 元/小时

阶跃星辰发布新一代语音识别模型,推理速度提升 400%,支持 30 分钟音频一次性转写,定价仅为上代的 1/10

avatar for toolin小编
toolin小编
2天前
UniWorld-V2.5:国产AI生图对齐GPT-Image-2
AI产品

UniWorld-V2.5:国产AI生图对齐GPT-Image-2

兔展智能发布UniWorld-V2.5,在中文密集文字、信息图、GUI界面生成等场景对齐GPT-Image-2,支持免费在线体验。

avatar for toolin小编
toolin小编
1天前