TRELLIS.2 - 微软开源的大型3D生成模型
TRELLIS.2是微软开源的大型3D生成模型,拥有40亿参数,专注于高保真图像到3D的生成。采用创新的“O-Voxel”稀疏体素结构,能高效处理复杂拓扑和锐利特征,生成具有全PBR材质的高质量3D资产。模型支持多种分辨率,从512³到1536³,能在NVIDIA H100 GPU上快速生成,如512³分辨率仅需约3秒。
TRELLIS.2的功能特色
高质量与高效率:40亿参数的模型能快速生成高分辨率、全纹理的3D资产,支持多种分辨率,生成速度在NVIDIA H100 GPU上表现出色,例如512³分辨率仅需约3秒。
复杂拓扑处理:采用“O-Voxel”稀疏体素结构,能稳健地处理开放表面、非流形几何和内部封闭结构等复杂拓扑,突破了传统方法的限制。
丰富纹理建模:支持基础颜色,还能模拟粗糙度、金属度和不透明度等表面属性,支持透明度和逼真渲染,生成的3D资产具有高度的视觉真实感。
极简数据处理:数据处理流程无需渲染和优化,可在短时间内完成纹理网格与O-Voxel之间的转换,大大提高了处理效率。
开源与易用性:基于MIT许可开源,支持Linux系统,需要至少24GB显存的NVIDIA GPU。预训练模型可在Hugging Face上获取,便于用户快速上手和应用。
TRELLIS.2的核心优势
高保真3D生成:能生成具有复杂形状和纹理细节的高质量3D资产,支持多种分辨率,生成效果逼真。
高效处理能力:利用稀疏体素结构和优化算法,显著提升生成速度,例如在512³分辨率下仅需约3秒,适合大规模应用。
强大的拓扑适应性:突破传统限制,能够处理开放表面、非流形几何和内部封闭结构等复杂拓扑,适用范围广。
丰富的材质支持:支持基础颜色,还能模拟粗糙度、金属度和不透明度等PBR材质属性,生成的3D资产可用于高质量渲染。
极简数据处理流程:无需复杂的渲染或优化步骤,快速完成纹理网格与O-Voxel之间的转换,大大简化了处理流程。
TRELLIS.2官网是什么
项目官网:https://microsoft.github.io/TRELLIS.2/
Github仓库:https://github.com/microsoft/TRELLIS.2
HuggingFace模型库:https://huggingface.co/microsoft/TRELLIS.2-4B
arXiv技术论文:https://arxiv.org/pdf/2512.14692
在线体验Demo:https://huggingface.co/spaces/microsoft/TRELLIS.2
TRELLIS.2的适用人群
3D艺术家和设计师:能快速生成高质量的3D模型,帮助他们快速迭代设计,节省建模时间,提升创作效率。
游戏开发者:适用于需要快速生成复杂3D资产的游戏开发场景,能生成高分辨率、具有丰富材质的3D模型,提升游戏视觉效果。
影视特效团队:可用于快速生成逼真的3D场景和道具,支持多种材质和纹理,满足影视制作中对高质量3D内容的需求。
虚拟现实(VR)和增强现实(AR)开发者:能生成适合VR和AR应用的高保真3D模型,提升沉浸感和用户体验。
人工智能和机器学习研究人员:作为强大的3D生成模型,可用于研究3D生成技术、模型优化和新算法开发。
教育工作者和学生:为相关专业的教学和学习提供工具,帮助学生快速掌握3D生成技术,探索3D建模和渲染的应用。