加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    •  打造虚拟世界需要多种AI 类型
    •  让创作者能够修改形状、纹理、材质
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

世界一流:NVIDIA研究团队构建AI模型,为虚拟世界填充3D物体和人物

2022/09/27
364
阅读需 5 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

得益于NVIDIAResearch 新的AI模型,越来越多的公司和创作者创建的大型虚拟世界可以更轻松地填充一系列多种多样的3D 建筑、车辆、人物等内容。

NVIDIAGET3D 仅使用2D图像进行训练,可生成具有高保真纹理和复杂几何细节的三维图形。这些3D对象的创建格式与热门图形软件应用所用的格式相同,允许用户立即将其形体导入3D渲染器和游戏引擎,以便进行后续编辑。

其所生成的对象可用于建筑、户外空间或整个城市的3D表现,为游戏、机器人开发、建筑和社交媒体等行业量身打造。

GET3D可以根据受训练时使用的数据生成几乎无限量的三维图形。就像一位艺术家将一块粘土制成精细的雕塑一样,该模型会将数字转换为复杂的三维图形。

例如,借助2D汽车图像的训练数据集,它创建了轿车、卡车、赛车和面包车等系列集。当在动物图像上训练后,它会生成狐狸、犀牛、马和熊等生物。如果输入椅子时,模型会生成各种旋转椅、餐椅和舒适的躺椅。

NVIDIA AI 研究副总裁Sanja Fidler负责领导创建此工具的多伦多AI实验室,她表示:“GET3D 让我们离普及AI 驱动的3D内容创作更近了一步。它能够即时生成纹理化的三维图形,这可能会为开发者带来颠覆性的变化,有助于他们迅速填充包含各种有趣对象的虚拟世界。”

在11 月26 日至12 月4日于新奥尔良(以及在线)举办的NeurIPS AI大会上,NVIDIA有20 多篇论文、专题研讨会,GET3D 就是其中之一。

 打造虚拟世界需要多种AI 类型

现实世界充满了多样性:街道上的建筑各有特点,各有不同的车辆则在其间呼啸而过,川流不息的人群更是异彩纷呈。为反映这一情景的3D虚拟世界进行手动建模非常耗时,因此难以填入详细的数字环境。

以前的3D 生成式AI模型,虽然比人工方法更快,但在所能生成的细节水平上也被限制了。即使是最近的反向渲染方法也只能根据从多个角度拍摄的2D 图像生成3D物体,这就需要开发者一次构建一个三维图形。

相反,在单个NVIDIA GPU上运行推理时,GET3D每秒可生成大约20 个形体,就像处理2D图像的生成式对抗网络一样,只是生成的是3D对象。作为学习来源的训练数据集更大、更多样化,输出也会更多样化,并且更详细。

NVIDIA研究人员使用合成数据训练GET3D,数据中包含使用不同摄像头角度拍摄的三维图形2D图像。该团队仅用了两天时间,就使用NVIDIAA100 Tensor Core GPU,对模型进行了100 万张图像的训练。

 让创作者能够修改形状、纹理、材质

GET3D的名称源于其能够生成显式纹理3D (GenerateExplicitTextured3D)网格,这意味着它会以三角形网格的形式创建形体并使用纹理材质覆盖,就像papier-mâché模型一样。这使得用户能够轻松地将对象导入游戏引擎、3D建模软件和电影渲染器,并进行编辑。

在创作者将GET3D生成的形体导出到图形应用后,当这些物体移动或旋转时,就能使用逼真的照明效果。通过整合 NVIDIAResearch 提供的另一种AI 工具StyleGAN-NADA,开发者可以使用文本提示将特定风格添加到图像中,例如将渲染出的汽车调整为被烧毁的汽车或出租车,或将普通房屋设置成鬼屋。

研究人员指出,未来版本的GET3D可以使用摄像头姿态预估技术,让开发者能够使用真实世界的数据(而不是合成数据集)来训练模型。还可以对其进行改进以支持通用生成,这意味着开发者可以一次性训练用于各种三维图形的GET3D,而不必每一次在一个对象类别上进行训练。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
LM3886T/NOPB 1 Texas Instruments 68W, 1 Ch, 20-94V supply stereo Class-AB amplifier w/ Mute 11-TO-220 0 to 70

ECAD模型

下载ECAD模型
$7.64 查看
TS4962IQT 1 STMicroelectronics 3W filter-free Class D audio power amplifier with active low standby mode

ECAD模型

下载ECAD模型
$1.49 查看
TPA3220DDW 1 Texas Instruments 60-W stereo, 110-W mono, 7- to 32-V, analog input Class-D audio amplifier w/ low idle, pad-down 44-HTSSOP -40 to 85

ECAD模型

下载ECAD模型
$1.94 查看
英伟达

英伟达

为这个时代的达芬奇和爱因斯坦们提供超强计算性能。我们开创性地开发出一种超强计算形式,深受全世界对计算机有超高要求的用户的青睐,包括科学家、设计师、艺术家和游戏玩家。对于他们而言,我们的创造几乎可媲美时间机器。基于对更优质 3D 图形永无止境的需求以及当下庞大的游戏市场,NVIDIA 已在这个虚拟现实、高性能计算和人工智能的交叉口,将 GPU 发展为计算机大脑。

为这个时代的达芬奇和爱因斯坦们提供超强计算性能。我们开创性地开发出一种超强计算形式,深受全世界对计算机有超高要求的用户的青睐,包括科学家、设计师、艺术家和游戏玩家。对于他们而言,我们的创造几乎可媲美时间机器。基于对更优质 3D 图形永无止境的需求以及当下庞大的游戏市场,NVIDIA 已在这个虚拟现实、高性能计算和人工智能的交叉口,将 GPU 发展为计算机大脑。收起

查看更多

相关推荐

电子产业图谱