重塑3D生成核心理论:VAST港大清华用“零”训练数据生成了3D模型澎湃号·湃客澎湃新闻

AI生成3D模型最难的一关,终于被搞定了。

无需任何训练数据,只需对着模型描述一句话,如「一个做作业的香蕉人」:

或是「一只戴着VR眼镜的猫」:

就能生成符合描述的带有高质量纹理贴图的3D场景。不仅如此,还能对已有的3D模型进行精细化贴图。

这是港大与清华大学联合3D生成明星公司VASTAI研发的一种新方法,它能够从复杂的文本描述中,直接生成富有想象力的高质量3D模型。

目前,这项研究成果已被人工智能顶级会议ICLR2024收录,代码也已经开源。对这项研究感兴趣的小伙伴,可以戳下方项目主页和论文地址查看。

论文标题:Text-to-3DwithClassifierScoreDistillation

所以它究竟是如何做到的?在了解新方法是什么之前,我们先来了解目前已有的方法存在什么问题。

传统生成模型面临的困境

在交互式游戏、电影艺术、增强/虚拟现实以及仿真技术等多个应用场景中,高质量的三维资产创建一直是一个重要且具有挑战性的问题。

目前大多数生成模型都依赖于本领域的大量高质量数据做训练,但在3D领域,这样的数据集非常匮乏。这导致目前基于3D数据训练的3D生成模型的效果还无法复刻图像领域的成功。

基于2D先验的3D生成方法

为了解决这一问题,Google的DreamFusion首次提出ScoreDistillationSampling(SDS)的方法,证明了可以通过预训练的二维扩散模型生成高质量和复杂的三维结果。这一范式的优势在于无需任何3D数据预训练即可生成3D模型,这一架构也一直被研究者们和后续工作所沿用,例如Nvidia的Magic3D等。其核心理论在于通过激励其渲染图像移向文本条件下的高概率密度区域,来反向生成3d场景。

尽管基于SDS的方法取得了令人瞩目的成果,然而,本文的研究者们发现,基于SDS的方法在实际实现中总是与理论出现一些差距,主要是因为普遍依赖于Classifier-FreeGuidance(CFG)。

在使用CFG时,推动优化的梯度实际上包含两个部分:一是数据密度的梯度,二是后验函数的梯度。其中前者对应于SDS理论中的关键部分,而后者仅仅是在实验过程中才加入的辅助手段。

分类器分数蒸馏:重塑3D生成的关键所在

这篇论文的核心贡献,在于重新评估了SDS中CFG的角色,发现CFG不仅仅是辅助手段,恰恰相反,它才是文本到三维生成中的关键驱动。由于这一部分可以被解释为一个隐式的分类模型,研究者们将这一新范式命名为分类器分数蒸馏(ClassifierScoreDistillation,CSD)。

这一发现从根本上改变了我们对基于分数蒸馏成功的文本到三维生成机制的理解。具体而言,其有效性来自于从隐式分类器中提炼知识,而不是依赖于生成先验。

CSD的引入使得我们能够重新审视现有技术设计选择。例如,研究者们展示了负面提示可以被视为负分类器分数,从而制定了一个渐进式的负分类器分数优化策略,这增强了生成质量,同时保持了与提示的结果忠实度。

此外,研究还揭示了利用分类器分数进行高效的基于文本驱动的三维编辑的可能性,以及将变分分数蒸馏技术(VariationalScoreDistillation)视为一种自适应性的负分类器分数优化形式。

实验效果

CSD不仅在理论上对文本到三维生成领域提供了新的视角,而且在实际应用中也表现出优越的性能。

在主要的3D生成任务上的实验结果显示,在文本对齐和视觉质量方面,该方法相较于DreamFusion、Magic3D、Fantasia3D等现有技术有显著提升,生成的纹理也真实丰富。

在速度上,CSD在单个A800GPU上只需1小时即可完成任务,而能达到同样视觉效果的ProlificDreamer方法则需要长达8小时。这一显著的速度优势,加上其出色的生成质量,证明了CSD技术的高效性和实用性。

此外,定量评估中采用的CLIPR-Precision指标进一步证实了CSD的优越性。用户研究也显示59.4%的参与者更倾向于选择CSD生成的结果。

实验部分还对比了CSD在纹理生成这一任务上的能力,与多个方法进行比较,实验结果显示无论从效果还是用户研究中都优于其他方法。

此外,研究者们还展示了如何利用CSD对现有的3D场景进行编辑,如下图所示,你可以使用CSD将一个香蕉人编辑为一个黄瓜人,将模特身上的苔藓编辑为鲜花,而不损失其他部分。

总而言之,CSD从理论出发,重新思考了目前3D生成的关键所在,重塑优化目标,最终在多个任务上显示出其优越性与强大的潜力。通过对这一新范式的深入探索和应用,我们能够更有效地从文本描述中生成高质量、高精度的三维内容,这对于三维内容创造领域的未来发展具有深远的影响。

THEEND

投稿或寻求报道:content@jiqizhixin.com

继续滑动看下一个

重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型轻触阅读原文

原标题:《重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型》

THE END
1.运用3d技术建立数字化模型模大狮模型网3d模型数据化3D扫描:使用3D扫描仪或激光测量仪对物体进行扫描,将其表面形态等信息转化为数字化数据。 CAD建模:使用CAD软件进行3D建模,手工输入物体的尺寸、形态、结构等信息,创建数字化模型。 数字图像处理:利用数字图像处理技术,对物体的照片或视频进行处理,提取出物体的形态信息,并转化为数字化数据。 https://blog.csdn.net/modashi3dmax/article/details/135559413
2.14.试述数据模型的概念数据模型的作用和数据模型的三个要素③数据的约束条件:是完整性规则的集合,完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。(数据模型是数据库系统的基础。任何一个DBMS都以某一个数据模型为基础,或者说支持某一个数据模型。数据库系统中模型有不同的https://easylearn.baidu.com/edu-page/tiangong/questiondetail?id=1811479608639750659&fr=search
3.全空间数据模型M3D全面升级!模型轻量化与可视化能力双“飞跃&amp全空间数据模型M3D全面升级!模型轻量化与可视化能力双“飞跃" 随着“空天地”立体数据采集技术以及5G、云计算、大数据和人工智能等新技术的迅速发展,实景三维中国、数字孪生城市、数字孪生水利的建设如火如荼,全空间三维地理空间数据呈指数级增长,如何更好地管理这些数据一直备受业界关注。https://tech.china.com/article/20240926/092024_1581987.html
4.BIM3D模型数据结构包括几种?BIM3D模型数据结构分析模型图元是整个3D建筑信息模型的物质基础,所有构配件对象及其属性和操作都定义于此。换言之,模型核心数据都集中于模型图元,模型图元是3D建筑信息模型数据的最终载体。为此要研究3D建筑信息模型的数据结构也就归结为研究模型图元的数据结构。 BIM建筑信息模型中,模型图元的数据结构包括基本数据和扩展数据两种。基本数据包括几http://www.tuituisoft.com/bim/25376.html
5.轴承3D模型(内附数据表)3D素材下载编号23958664轴承3D模型(内附数据表)3D素材下载由我图网提供,.3dm格式,下载源文件即可自行编辑修改源文件里的文字和图片,更多有关3D素材、人物IP、游戏模型、植物/动物、其他图片素材免费下载请关注我图网。https://weili.ooopic.com/weili_23958664.html
6.3dwarehousesketchup官方模型库Share your models and get inspired with the world’s largest 3D model library. 3D Warehouse is a website of searchable, pre-made 3D models that works seamlessly with SketchUp. 3D Warehouse is a tremendous resource and online community for anyone who creates or uses 3D models. https://3dwarehouse.sketchup.com/
7.最新!OMNI3D:3D目标检测的大型基准和模型(MetaAI)简介:由于2D识别的成功,论文引入了一个大型基准,称为OMNI3D,重新审视了3D目标检测的任务。OMNI3D对现有数据集进行了重新利用和组合,生成了234k张图像,标注了300多万个实例和97个类别。由于相机内参的变化以及场景和目标类型的丰富多样性,这种规模的3D检测具有挑战性。论文提出了一个名为Cube R-CNN的模型,旨在通过统https://developer.aliyun.com/article/1143392
8.将3D数字模型连接到其他表数据Documentation您不仅希望与他们共享建筑群的 3D 模型,还希望使用包含在单独表中的附加信息来增强该模型,该表中记录了每个单元的空间使用情况和可用性。 设置ArcGIS Pro场景后,您将向其中添加 3D 模型并将数据表连接到模型。 然后,您会将ArcGIS Pro场景作为 Web 场景发布到Portal for ArcGIS。 您的所有协作者都将能够在其 Webhttps://learn.arcgis.com/zh-cn/projects/connect-a-3d-digital-model-to-additional-table-data/
9.阿里开源大型3D家具数据集,2D物体“秒变”3D模型阿里资深算法专家乐田表示:“3D重建是3D机器学习的核心,只有在高质量3D数据集支持下,工业级3D AI建模才能满足更大规模的产业需求。”目前,阿里3D AI技术已成功应用在淘宝3D购、躺平设计家等场景中,该技术可迅速批量生产高质量3D模型,业内估计将降低9成建模成本,有望破解自动驾驶、VR、AR等领域相关产业难题。 https://www.51cto.com/article/624737.html
10.详解3D打印常见数据格式3D打印学习中心SLM) 等. 由于所有技 术工艺均以数字化模型文件为基础,在 3D 打印的 整个制造过程中都需要进行大量的数字化模型文件 的准备及处理,所以,不同的数据文件格式会直接影 响加工过程和加工效果. 因此,研究 3D 打印过程中 的数据文件格式是十分必要的. 这里主要介绍了 3D 打印过程中的数据文件格 式,包括三维数据http://www.nuoyan3d.com/xuexizhongxin/3333.html
11.大数据可视化3d模型有哪些帆软数字化转型知识库大数据可视化3D模型包括:三维柱状图、三维散点图、三维热力图、三维地理空间可视化、3D网络图、3D流场图,这些模型在展现复杂数据时能提供更直观和交互性强的体验。三维柱状图在数据维度间的比较和展示上尤为有效,通过高度和颜色变化传达信息的不同维度,帮助用户快速理解数据的趋势和差异。 https://www.fanruan.com/blog/article/202361/
12.J3D数字孪生设计器3D数据可视化工具最简单高效的方式,构建3D可视化数据应用 在线协同 实时流畅 用户可以传三维模型到资产库中,并对其进行管理。 生态拓展 数据保密 用户可以传三维模型到资产库中,并对其进行管理。 微服务技术架构 用户可以传三维模型到资产库中,并对其进行管理。 结合RBI 开放更多应用场景 海量三维模型资产库 用户可以传https://fulima.com/platform/Twin_designer.htm
13.什么是3D建模其强大之处在于管理3D模型数据的数据库,使得输入、结构化、修改、创建原型和优化模型数据库非常容易。前几年与一家从事数字城市的公司合作时我们就用Creator快速创建大量的城市建筑模型,并且生成数据库来管理这些模型,还是相当的方便。 注:从上述介绍可知,美国Autodesk公司当之无愧是当今3D建模和动画的“老大”,拥有https://www.to8to.com/yezhu/z182824.html
14.3DEXPERIENCE3DEXPERIENCE2D设计3DEXPERIENCE是一个数据驱动的平台。从市场/客户的需求—>功能分析—>到系统的逻辑架构—>物理3D模型,都是由单一数据来驱动这整个设计活动,并且实现全生命周期的可追溯。从物理3D模型—>系统集成—>系统验证—》系统确认—>符合要求的产品的所有活动都基于数据来驱动产品的整个生命周期。 https://www.ruanfujia.com/10640430/
15.数控技术应用专业3D打印实训室简介根据扫描数据模型,利用切片软件进行打印工艺设计,并使用打印机,对完成的模型进行3D打印。打印后的模型零件要求进行必要的后处理并满足任务书中规定的颜色要求、功能要求。 (三)应用设计与3D 打印 根据任务需求,使用三维建模软件,完成应用设计并进行3D打印,该任务将依托生活中的实际场景,培养选手通过3D打印解决生活中实际http://www.tgzhz.com/nd.jsp?id=838