toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具940个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

腾讯混元3D世界模型2.0:一句话造出可编辑3D世界

2026/04/17
·toolin小编

腾讯开源 HY-World 2.0,支持文字、图片、视频输入生成可漫游的3D空间,输出 Mesh/3DGS 资产可直接导入游戏引擎。

腾讯混元3D世界模型2.0:一句话造出可编辑3D世界
腾讯混元3D世界模型2.0:一句话造出可编辑3D世界
2026/04/17

腾讯混元3D世界模型2.0:一句话造出可编辑3D世界

腾讯开源 HY-World 2.0,支持文字、图片、视频输入生成可漫游的3D空间,输出 Mesh/3DGS 资产可直接导入游戏引擎。

HY-World 2.0 是什么核心功能多模态输入角色漫游模式3D 资产导出技术亮点端到端全景生成路径智能规划新视角生成(NVS)实际体验效果上手方式
AI产品

腾讯混元团队发布了 3D 世界模型 2.0(HY-World 2.0),这是一款多模态世界模型,能够理解文字、图片、视频输入,自动生成可漫游、可交互、可二次编辑的 3D 世界。与之前只能生成视频的世界模型不同,HY-World 2.0 直接输出可导入 Unity、UE 等引擎的 3D 资产。

适合人群:游戏开发者、关卡设计师、具身智能研究者、3D 内容创作者。

HY-World 2.0 是什么

简单类比:以前的世界模型给你一段视频,HY-World 2.0 给你一个可以走进去的空间。

HY-World 2.0 的核心能力是三个:世界生成(从文字/图片/视频创建3D空间)、世界重建(从多视角图片重建精确3D场景)、全景图生成。

输入"生成一个温馨的绘本风格小木屋",即可生成角色可自由穿行的3D空间。

核心功能

多模态输入

  • 文字生成:输入提示词,如"生成一个日式RPG风格的中世纪地牢"
  • 图片生成:上传一张参考图,模型据此生成3D空间
  • 视频生成:输入一段视频(如游戏实况),模型捕捉运动轨迹和场景
  • 多视角图片:上传多角度照片,重建效果最佳

角色漫游模式

用户可以操作角色在生成的3D场景中自由探索,具备物理碰撞效果。角色走楼梯、过桥梁时移动形态自然流畅,可用于测试空间结构。

3D 资产导出

生成的场景采用 3D 高斯泼溅(3DGS)表示,同时可导出高质量 Mesh。支持格式包括 Mesh、3DGS、点云等,可直接无缝导入 Unity、UE 等主流游戏引擎进行二次编辑。

技术亮点

端到端全景生成

HY-Pano-2.0 方案采用端到端隐式学习,无需任何相机参数,就能从普通图片或视频生成 360 度全景映射。混元团队通过真实全景照片和 UE 合成数据混合训练来保证质量。

技术架构

路径智能规划

结合自研空间 Agent 技术和 Navmesh 表征,模型可自动规划角色漫游路径。根据场景语义规划五类运镜轨迹(环绕物体、最大漫游等),覆盖关键区域的同时避免穿墙。

新视角生成(NVS)

通过精确的相机控制、细粒度视觉细节保持和空间一致性记忆机制,多条运镜的生成结果保持空间一致不冲突。后训练算法确保在快速扩展新区域时画面质量不衰减。

实际体验效果

文字生成:输入"生成一个原神风格的空中花园迷宫",纵深的平台、曲折的楼梯、藤蔓桥梁、彩色玻璃等细节还原较好。角色可在场景中自由漫步。

视频输入:用《生化危机》实况视频,模型能捕捉角色运动轨迹和街道两侧布景,但3D还原完整度还有提升空间。

多视角图片:使用 32 张三层屋檐建筑素材,模型复刻建筑外型和层级结构效果最好,细节和层次感保留完整。

多视角重建

上手方式

  • 在线体验:https://3d.hunyuan.tencent.com/sceneTo3D
  • 开源代码:https://github.com/Tencent-Hunyuan/HY-World-2.0
  • 技术报告:HY-World 2.0 PDF
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
HY-World 2.0 是什么核心功能多模态输入角色漫游模式3D 资产导出技术亮点端到端全景生成路径智能规划新视角生成(NVS)实际体验效果上手方式

相关文章

Lovart:AI 驱动的一人品牌部
AI产品

Lovart:AI 驱动的一人品牌部

Lovart 的 Brand Kit 功能可以自动解析品牌手册、生成品牌字体、批量输出统一调性的视觉物料,月费 340 元起。

avatar for toolin小编
toolin小编
1天前
Claude Code 会话管理实战指南
AI教程

Claude Code 会话管理实战指南

掌握 Claude Code 的上下文窗口、回溯、压缩和子智能体,让 AI 编程助手发挥最大效能的实操技巧。

avatar for toolin小编
toolin小编
1天前
阿里 Meoo:说话就能上线的 AI 开发工具
AI产品

阿里 Meoo:说话就能上线的 AI 开发工具

阿里 ATH 出品的零代码 AI 开发工具 Meoo(秒悟),通过自然语言对话即可生成完整应用并一键部署上云。

avatar for toolin小编
toolin小编
1天前