3D 生成,一直在等待它的「ChatGPT时刻」。
首先,3D 内容在艺术质量、生成速度、3D 网格结构和拓扑质量、UV 贴图结构以及纹理清晰度和分辨率方面具有严格的标准; 其次,与其他研究相比,可用的数据量少。虽然该领域有数十亿张图像和视频可供学习,但可用于训练的 3D 内容数量要少三到四个数量级。因此,现阶段的3D 生成还必须从非 3D 的图像和视频中学习,而且需要从部分 2D 观察中推断出 3D 信息; 传统方法生成的3D 资源通常难以实现逼真的照明和材质属性,从而限制了它们在专业工作流程中的实用性; 3D生成是一个非常耗费算力的过程,主要因为它涉及到复杂的计算和大量的数据处理,如实时渲染、细节处理。并且由于算力不够,可能会导致生成速度非常慢。
论文地址:https://ai.meta.com/research/publications/meta-3d-gen/?continueFlag=24428397aaeb0cc6751570d48a532d36
综合排序为:Meta 3D Gen > Third-party T23D generator > Tripo3D > Meshy v3 > CSM Cube 2.0 > Rodin Gen-1 。其中前三名差距很小(3个点的差距,404个prompt中的12个)。CSM和Rodin相较其他方法有明显差异,Rodin和3DGen相比,两者相差 21.8个点。 分项评测方面,最简单的objects中表现最好的是Meshy v3。角色类和复杂组合概念的表现代表了技术水准,也是3D产业应用中最重要的部分,Meta在复杂组合上排名第一,Tripo3D则是难度越高表现越强,仅次于Meta,和第一名差距很小。
Meshy v3纹理分最高、Rodin纹理分最低; Rodin几何分比较高; 在综合性一致性、整体质量方面,Rodin表现不佳; All users和专业用户打分标准可以看出略有不同,但排名趋势是一样的:对几何和纹理的正确性给予了更多的权重;