在移动游戏的发展历程中,功耗与性能的博弈从未停歇。过去,开发者不得不在画质、帧率与电池续航之间做出痛苦的取舍,移动端的游戏体验似乎天然地矮桌面端一截。传统静态光影烘焙虽可降低实时算力开销,却带来了光照贴图UV分辨率不足、漏光瑕疵、高光质感平淡以及开发调试周期冗长等生产线痛点。

来源:Arm
针对此行业瓶颈,Arm推出了将“图形计算与神经计算”深度集成的移动图形技术,并通过其与Sumo Digital历时18个月开发的第三人称冒险手游《光影新生》进行了生产工作流的实战验证。这套架构的核心演进在于将专用神经加速器引入了GPU生态,并整合至面向移动端的 Arm CSS(计算子系统),从而直接将 AI 融入了实时图形渲染管线。

来源:Arm
核心技术架构与算法解析
Arm开发者生态系统战略总监Peter Hodges告诉与非网,这套神经渲染架构的核心价值,在于利用专用神经加速器与传统图形任务并行运行,在固定的功耗预算内释放大量性能空间。其核心算法主要由三大模块协同运作:
- 神经超级采样(NSS):该技术基于卷积神经网络构建,聚焦于像素级的增强重建。在输入端,NSS 除了调取场景色彩、深度与运动矢量等常规几何与时序信息外,还会深入调取历史渲染帧数据。该模型属于“实时时域超级采样参数预测模型”,经由专用硬件协同设计,每次调用皆对整个网络进行一次性运算,并采用分块处理方式以达成高能效。在实际应用中,建议采用两倍的超分比例,以实现最佳的图像保真度与性能优化。
- 神经超级采样与降噪(NSSD):光线追踪在移动端运行时,通常需要先输出低分辨率的噪点画面以节省算力。NSSD技术能在保留图像微观细节的同时,精准消除光追产生的噪点,从而有效降低移动端整体的渲染负载。
- 神经帧率提升(NFRU):当复杂着色与光追等先进视效使单帧光栅化渲染时间面临瓶颈时,NFRU 提供了帧生成的优化抓手。它利用管线中已有的运动数据与时序信息进行神经推理,在传统渲染帧之间智能合成中间帧,从而将原生30fps的内容高效翻倍至60fps。由于硬件上采用了跳过整帧传统光栅化、转而执行轻量化神经负载的机制,此技术在原理上需要系统对下一帧进行前瞻预测,因此不会引入额外的操作延迟。
MegaLights 引入移动端的算力表现
在神经图形技术的支持下,《光影新生》成为全球首款启用虚幻引擎MegaLights技术的手游。MegaLights技术允许在单一场景中部署数百个动态、可移动光源,并支持实时光线追踪阴影。

来源:Arm,Sumo
在传统渲染管线中,此类复杂直接光照的算力开销会随着光源数量与场景复杂度呈指数级飙升。然而在底层神经渲染架构的支撑下,MegaLights的算力开销能基本保持在一个相对固定的水平。
“这意味着即便场景内的物件与光影复杂度显著提升,整体的计算负载也不会出现明显波动,从而成功为我们的美术团队抹去了预烘焙静态光照的束缚,实现了开发阶段的实时光照预览与高效率迭代。” Sumo Digital美术总监兼《光影新生》游戏总监Lukáš Medek解释道。
开源生态与引擎集成规范
为加速该技术在开发者社区的落地,Arm采取了独立于引擎的开源策略。根据Arm官方资料显示,其发布的Arm神经图形软件开发套件v1.0.0架构源自AMD FidelityFX SDK,确保了API设计的无缝兼容性。
该SDK在底层架构上具有高度的模块化与层级分化特征:
- API 层(用例提供者):作为SDK与游戏引擎之间的主要接口,负责对上层开放如NSS、NFRU或NSSD等特定功能模块。
- 组件层:包含神经网络推理、着色器逻辑和运行时编排等算法的具体实现。
- 后端层:基于跨平台图形API Vulkan构建,目前已透过Vulkan模拟层支持Linux和Windows平台,且原生安卓支持也已纳入路线图。

来源:来源:Arm,Sumo
在商业引擎整合层面,适用于虚幻引擎5.4的NSS插件已正式分发,该插件凭借调用SDK的API层,可实现虚幻引擎的“UE::Renderer::Private::ITemporalUpscaler” 接口。它将Vulkan指定为默认的渲染硬件接口,并全面兼容ES3.1、SM5以及SM6等多种着色器模型配置文件。
这套神经网络技术基于宽松的MIT许可协议进行开源分发。除了预训练模型外,其开放的模型架构允许开发者结合自身游戏的特定视觉与风格需求,进行自定义的二次训练。这种高度弹性的策略,让开发团队能依据目标设备的配置,在画质、能效与算力成本之间精确调校出最佳的动态平衡。
来源: 与非网,作者: 夏珍,原文链接: https://www.eefocus.com/article/2035460.html
389
