2017年,英伟达与上海交通大学联合举办了RISC-V工作坊,这是北美地区以外的首个RISC-V工作坊。当时英伟达的重点是其处理器中的嵌入式MCU,尽管尚未发布具体产品,但已看好其前景。如今,英伟达的集成了RISC-V内核MCU的产品的出货量每年突破10亿颗,这一成绩距离2017年的工作坊已过去八年,验证了当初的判断。
7月17日,第五届RISC-V中国峰会现场,英伟达副总裁Frans Sijstermanns分享了英伟达在RISC-V领域的长期布局与最新进展。
Frans Sijstermanns表示,目前,英伟达的处理器出货量已超数十亿颗,加速计算架构是业务增长的核心。20年前,CPU是软件运行的核心;后来GPU的出现推动了加速计算,英伟达为此开发了CUDA。目前CUDA仅部署在x86和Arm架构上,但未来英伟达将把它移植到RISC-V。
CUDA的移植包含两大核心组件:
Toolkit(工具箱):作为编译器,负责高效的编译功能;
驱动器:支撑CUDA在硬件上的运行。
Frans Sijstermanns进一步说明:"在应用运行全流程中(包括应用软件、第三方软件、OS系统),目前CUDA的重点移植的是下图中的绿色部分(如PyTorch示例中的CUDA KMD、CUDA UMD)。此外,第三方软件和应用软件也需同步移植到RISC-V。"
英伟达在加速计算领域深耕20年,已建立900多个行业库,覆盖推理加速(如FT库)、数据分析、芯片制造加速等不同垂类。"RISC-V的落地将让我们所有库都能在RISC-V上运行,推动各行业技术快速迭代与创新。"Frans Sijstermanns强调。
尽管RISC-V在过去几年取得长足进步,但仍面临挑战。2022年后,RISC-V国际基金会已获批10余项新规格(如RVA23、服务器SoC规范);基金会官网显示,75个软件包已在RISC-V上运行,包括Linux、工具链、数据库、网络虚拟机等。
"但可用性仍是关键。"Frans Sijstermanns指出,"例如,CUDA在RISC-V上的开发需要CPU与GPU协同,但目前尚未完全对标RVA23或新获批的SoC规范。我们亟需统一虚拟内存,实现CPU与GPU内存数据的高效共享、复制及一致性,同时优化虚拟监管器,最终落地RVA23技术细节。"
为解决上述挑战,英伟达正与生态合作伙伴紧密协作:"我们不仅希望改进CUDA在RISC-V上的适配,更计划推出符合服务器平台规范及Linux RISC-V标准的CUDA版本。同时,我们倡导通过系统级开发,先解决CPU层面的关键问题,再逐步发布完整解决方案。"
Frans Sijstermanns指出,NVLink Fusion的整合架构可以发挥作用:"这是基于英伟达组件的完整设计,包含CPU、GPU、网络、转接开关处理器及软件集成,旨在通过整合式架构提升数据中心效率,这与RISC-V的部署密切相关。"
他表示,英伟达的加速计算业务不依赖特定CPU架构(x86、Arm或RISC-V均可兼容),该公司关注的是为用户和开发者提供选择权。通过CUDA,英伟达通信处理器可加速RISC-V服务器,提供全套硬件解决方案,实现从软件到硬件的愿景。这需要生态伙伴的共同努力——系统开发需要优秀的主机CPU,更需要整个产业链的协作,共同推动RISC-V在加速计算领域的落地。
1027