SceneMaker 是一个突破性的开源框架,能从单张图像生成完整的、带 Mesh 的 3D 场景,完美解决物体遮挡和空间位姿问题。


SceneMaker 是一个突破性的开源框架,能从单张图像生成完整的、带 Mesh 的 3D 场景,完美解决物体遮挡和空间位姿问题。
SceneMaker 是由 IDEA 研究院与香港科技大学联合推出的开源 3D 场景生成框架。它解决了当前 3D 生成领域最大的痛点——"半开放"窘境。 以往的模型只能生成简单的室内样板间,而 SceneMaker 能够处理开放世界中的任意图像(室内、室外、合成图),并生成包含完整 Mesh(网格)的可编辑 3D 场景。
智能去遮挡 (Decoupled De-occlusion) 现实照片中物体常互相遮挡。SceneMaker 能"脑补"出物体被挡住的部分。
精准位姿估计 (Pose Estimation) 它能准确计算出每个物体在三维空间中的位置、旋转和大小。
开放世界泛化能力 不局限于客厅或卧室。街道、公园、桌面摆件、甚至动漫手办,它都能重建。
对于游戏开发者、VR/AR 内容创作者以及具身智能研究者来说,SceneMaker 是一个极具价值的生产力工具。它将"2D转3D"的门槛再次降低,且质量达到了工业级可用的标准。

覆盖知识问答、代码开发、图片设计、视频生成、音乐创作等14个场景的2026年最实用AI产品推荐,每个场景同时推荐海外和国内方案

商汤发布 SenseNova U1 系列多模态模型,原生统一架构实现连续图文创作,免费开源,可作为 GPT Image 2 的国产替代方案

小米开源MiMo-V2.5和MiMo-V2.5-Pro两大模型,支持1M上下文、Token效率行业领先,附100万亿Token免费计划