日前召开的SIGGRAPH 2022大会上,英伟达宣布了针对元宇宙的几大重要进展:发布Omniverse重要版本、推出用于构建虚拟助手和数字人的云原生AI模型Omniverse Avatar Cloud Engine(ACE),并宣布了发展通用场景描述(USD)的大型计划,准备将该3D世界的开源和可扩展语言发展成为开放元宇宙和3D互联网的基础。

 

放眼国内外的元宇宙玩家,主要包括工具型公司、内容型公司、UGC创作公司、云服务商等等。英伟达作为提供关键技术支撑的工具型、平台型公司,算是最早在元宇宙领域推出具体工具支持和产品服务的企业之一,此次在SIGGRAPH上的发布,既有核心工具的重大更新、也有开放合作的具体计划,也将进一步夯实英伟达在元宇宙领域的布局和地位。

 

NVIDIA Omniverse和仿真模拟技术副总裁Rev Lebaredian表示:“元宇宙蕴含的商机价值数万亿美元,任何企业机构都不愿错过它,但许多企业机构找不到加入它的明确途径。NVIDIA Omniverse缩小了物理世界和虚拟世界之间的差距,这些新的工具、技术和合作项目让我们在今天就可以迈入3D互联网。”

 

降低创建和部署逼真虚拟助手和数字人的门槛

 

一些行业应用对数字人和虚拟助手的需求其实是在飞速增长的,但创建和扩展它们却变得越来越复杂。为此,英伟达推出了全新的用于构建和部署逼真虚拟助手和数字人的云原生AI模型和服务Omniverse Avatar Cloud Engine( ACE),它将帮助游戏、聊天机器人、数字孪生和虚拟世界的开发者提供用于构建和部署交互式虚拟形象的云原生AI模型,值得一提的是,它已经能够助力虚拟助手和数字人通过图灵测试

 

 

对于NVIDIA ACE推出的重要意义,Rev Lebaredian表示:“几十年来,我们所在的行业一直在教计算机如何轻松地交流和执行对人类来说十分轻松的复杂任务。NVIDIA ACE让这一切变得触手可及。ACE结合了许多复杂的AI技术,使开发者创造出将能够通过图灵测试的数字助手。”

 

据介绍,ACE建立在NVIDIA的统一计算框架基础之上。该框架为用户提供丰富的软件工具和API,使他们能够使用各种用于创建高度逼真的全互动式虚拟形象的技能。这些工具包括用于开发语音AI应用的NVIDIA Riva、用于计算机视觉和智能视频分析的NVIDIA Metropolis、用于高性能推荐系统的NVIDIA Merlin、用于自然语言理解的大型语言模型NVIDIA NeMo Megatron,以及用于AI赋能动画的NVIDIA Omniverse。ACE所支持的助手和虚拟形象,有望改变游戏、娱乐、银行、交通和酒店等领域的互动方式。

 

英伟达的Project Maxine和Project Tokkio是建立在ACE上的两个应用。Project Maxine为虚拟协作和内容创建应用带来了最先进的视频和音频功能。Project Tokkio赋予交互式虚拟形象以视觉、感知和智能对话能力,并使虚拟形象能够提供建议,以提高餐厅等场所的客户服务水平。

 

据了解,一些从事虚拟助手和数字人的开发者们,已经在计划使用ACE来加速其虚拟形象开发工作。


Omniverse发布重要版本更新

 

Omniverse是一个用于构建虚拟世界的多GPU可扩展计算平台,拥有高度逼真的物理模拟引擎以及高性能渲染能力。目前,已被全球约700家领先的公司用于改进建筑和产品设计、简化视觉效果工作流程以及构建工厂、城市和地球的数字孪生。可以说,它是英伟达打造元宇宙重要的组成部分,也是英伟达最重要的平台之一,几乎结合了英伟达有史以来的所有工作。

 

为了继续扩大Omniverse的应用生态,帮助艺术家、开发者和工程师更加轻松地构建虚拟世界和内容,并且更加无缝地连接当今领先的3D应用,Omniverse此次一举发布了多项AI工具和功能创新。

 

 

最新发布的平台更新主要包括:

 

首先,用于构建本地Omniverse扩展和应用程序的工具包Omniverse Kit,主要包括两方面进展:一是PhysX的更新,包括实时、多GPU、可扩展的柔体和颗粒布料仿真,能够帮助提高虚拟世界和物体的物理准确性。二是全新OmniLive Workflows:对Omniverse中基于USD的协作进行全面改造,为多个应用程序的3D工作流程带来更高的速度和性能并实现非破坏性的USD工作流程,使艺术家和开发者之间的协作比以往更容易。

 

其次,直接通过音频文件创建面部动画的AI工具Omniverse Audio2Face,其推理和生成逼真情绪的新功能为AI动画带来了巨大的飞跃,可用于制作所有面部特征动画。

 

第三,还有用于构建3D电影和动画电影的应用Omniverse Machinima,发布了数百个来自《战争附言(Post Scriptum)》等游戏的全新免费3D资产,以及Audio2Gesture(可以利用音频文件生成逼真手臂和身体运动的AI)等一套全新AI动画工具。

 

值得一提的是,Omniverse DeepSearch已面向Omniverse Enterprise客户开放。DeepSearch使用自然语言帮助团队利用AI直观、准确地在庞大的、未标记的3D视觉资产数据库中进行搜索。对于因拥有数十万未标记资产而使搜索成为一大难题的游戏开发商或视觉特效工作室而言,DeepSearch将带来巨大的改变。

 

另外,物理机器学习框架NVIDIA Modulus现已可用于为Omniverse扩展程序。经Modulus训练的物理机器学习模型可提供近实时的性能,根据不同的应用,其速度可提高4000甚至100000倍,并且具有前所未有、更接近高保真模拟的准确性。Modulus是NVIDIA Earth-2等科学数字孪生的基石之一。

 

除了上述全新应用和框架,英伟达还发布了多项核心仿真模拟技术的重大更新,这些技术在元宇宙世界中用于表示材质、物理和光线。其中,NVIDIA MDL支持物理级精确的3D材质表现,现已完全开源,使开发者能够为任何渲染器带来材质定义语言支持;即将发布公测版的NeuralVDB是OpenVDB的下一个升级版本,它为稀疏体积数据集带来了AI和GPU优化,并将这些海量数据集的内存占用率降低了多达100倍。


元宇宙的通用“语言”USD,继续扩大应用生态

 

在使用Omniverse打造元宇宙时,最关键的是通用场景描述(USD)技术。开源USD几乎已是业界公认的未来流程协作的数据格式,搭建起的流程适合团队协作。也就是说,它可以作为一个开放的API,支持复杂的场景贴图,专门在各式各样的场景、千差万别的应用程序之间帮助互换数据资产。此外,它还能够分层式管理数据资产,让许多不同部门的大型团队在同一个场景工作并共享数据,进行协同和分布式工作。

 

英伟达最新宣布的一项发展通用场景描述(USD)的大型计划值得关注,这意味着这一3D世界的开源和可扩展语言将发展为开放元宇宙和3D互联网的基础。

 

皮克斯动画工作室首席技术官Steve May表示:“USD是皮克斯动画制作流程的基石。作为一个开源框架,它在视觉特效和动画方面,以及工业、设计和科学应用方面都呈现出快速增长的势头。NVIDIA将帮助USD发展成为完全可互操作3D平台的开放基础,造福所有行业。”

 

Rev Lebaredian表示:“除了媒体和娱乐行业,USD还将助力3D艺术家、设计师、开发者等人员,在构建虚拟世界时能够在不同的工作流程和应用中进行协作。我们正在与合作伙伴社区一起投资发展USD,使其成为建筑、制造业、机器人、工程等领域的基础。”

 

据介绍,英伟达将与USD的发明者皮克斯以及Adobe、Autodesk、西门子等多家行业内领先的企业合作,实施一项多年发展路线图,将USD的功能扩展到视觉效果应用之外,使其能够更好地支持建筑、工程、制造、科学计算、机器人、工业数字孪生等领域的工业元宇宙应用。

 

 

未来,USD的更新还将包括:让所有国家和语言的用户都能参与USD的国际字符支持、实现城市规模和行星规模数字孪生的地理空间坐标支持,以及实现数字孪生与物理世界同步发展的物联网数据实时流式传输。

 

英伟达还与工业、设计、模拟和CAD软件生态系统中的合作伙伴一同发布了11个新的Omniverse连接器(Connector),这些基于USD的插件进一步向工业界和科学界的公司开放Omniverse工作流程。目前,Omniverse USD生态系统中的连接器总数已达到112个。

 

在SIGGRAPH上,英伟达还汇集了USD生态系统中的数百名工程和产品负责人,组成工作委员会,调整USD开发的优先事项并获取关于重点开发方向的反馈。目前,Adobe、Autodesk、皮克斯和西门子等众多公司都在为USD的发展提供帮助和支持。

 

随着越来越多合作伙伴扩展基于通用场景描述USD的应用,它将有望形成元宇宙的一项行业标准,也将进一步发展成为开放元宇宙和3D互联网的重要基础。