5G、数据中心、边缘计算稳稳支撑起未来以数据为中心的世界,也成为当前的重点创新领域。这三大领域的需求多样且仍在不断变化,相关解决方案提供商面临的挑战是:一方面需要继续在核心领域取得进步,例如提高数据传输和处理性能;另一方面,还要满足每个具体领域的独特需求。

 

为了保证架构的灵活性和多样化,计算平台正在异构的道路上狂奔。CPU巨头Intel,就在"以数据为中心"的转型中,将重心从CPU 转向异构计算的xPU战略上,以期通过转型加速增长,在史上最大的市场机会前防御成功、并继续扩大市场份额。

 

在所有的算力组合中,FPGA有其独特的一面。它最大的价值在于通过可编程架构所实现的灵活性,能够实现覆盖数据中心、企业级、边缘、嵌入式端的广泛应用。正因如此,FPGA成为Intel异构计算战略中的关键一环。

 

2019年5月,Intel推出了极具里程碑意义的新一代FPGA产品——Agilex,这是继收购Altera之后,Intel第一次完全从概念到设计、实施、验证直到最终生产制造都亲自操刀的一款端到端的产品,可以说“集多项Intel先进技术资源于一身”,被寄予厚望。

 

今年1月,Agilex系列FPGA实现了大规模量产出货。日前,Intel数据平台事业部副总裁兼可编程解决方案事业部(PSG)产品营销总经理Deepali Trehan,面向中国市场深度分析了这款高端FPGA的先进性。从公开数据来看,这款产品超出了Intel此前的性能预期,在最大时钟速率(Fmax)方面,实测数据比上一代14nm Stratix 10高出45%(之前的数据是提高40%)。

 


 
Intel数据平台事业部副总裁

可编程解决方案事业部(PSG)产品营销总经理Deepali Trehan

 

为什么需要高度灵活性?

 

Deepali Trehan强调了5G、数据中心和边缘三大领域的不同需求:5G方面,基础设施的某些环节需要超高能效,而无线应用中常见的信号处理功能需要高性能;云和企业领域,不断变化的基础设施和应用加速中有相当多的工作负载需要高性能和高能效;边缘方面,正在需要更高的计算力来满足对更高的交互、更多富媒体内容和更低的时延需求,同时仍需满足严苛的功耗、散热和空间限制要求。而贯穿这三方面的共同趋势,就是数据的爆增、快速变化的环境,以及用户对于快速部署的需求。

 

“这是我们当前所面临的挑战,因此需要更高的灵活性”, Deepali Trehan表示,“解决方案提供商必须通过得到良好支持的开发流程快速地把处理、内存、数字信号处理、专门接口和FPGA灵活性整合到高度集成化的组件中,满足目标市场的确切需求”。

 

据介绍,Agilex专为以数据为中心的世界而打造,在数据的处理、存储以及移动过程中,可以与Intel的其他先进技术相互结合,这款产品本身,也集合了Intel非常前沿的技术:采用异构3D系统级封装 (SiP) 技术,集成了Intel首款基于10纳米SuperFin 技术的FPGA架构和第二代HyperFlex FPGA 架构,实现了性能提升45%,可将数据中心、网络和边缘计算应用的功耗降低40%。

 

 

据了解,Agilex FPGA包含F、I、M三个系列:F系列适用于数据中心、网络和边缘的各种应用;I系列适用于需要大量接口带宽和高性能的应用;M系列提供面向英特尔至强处理器的一致性连接、HBM集成、增强型DDR5控制器和英特尔傲腾DC持久内存支持,针对需要大量内存和高带宽的数据密集型应用进行了优化。

 

F、I和M系列采用了不同的chiplet组合以实现差异化:I系列包括一个特别的chiplet,它支持F系列中没有的CXL接口。M系列包括一个增强的核心结构chiplet,让接口支持DDR5和英特尔傲腾持久内存。

 

“面向以数据为中心的世界,数据处理要求的激增,导致TCO(即总拥有成本,包括产品采购到后期使用、维护的成本)出现了巨大的提升”,Deepali Trehan解释,“越高的每瓦性能就越好,意味着有更优的计算力以及更少的能源消耗,FPGA是一种非常好的能够提升能源效率的架构。”

 

Agilex系列是Intel全新的产品品牌,并不是Stratix的延续。Stratix 10属于高性能FPGA,适合多数高端FPGA应用;Agilex F/I/M系列则进一步提升了行业标杆,提供领先的性能和能效,以及其它先进特性,比如116Gbps收发器、率先支持专注于AI的DSP模式(例如BFLOAT16和半精度浮点)、以及第一个面向傲腾持久内存的硬接口,因而在以数据为中心的世界中非常适合计算高度密集的FPGA应用。


正面PK赛灵思7nm Versal的三大技术底座

 

根据Intel方面提供的数据来看, Agilex FPGA比赛灵思的7nm Versal,逻辑结构性能功耗比高约2倍;算力方面,比赛灵思Versal超出了50%的视频IP性能提升。具体体现在以下五方面:

 

● Warp图像转换器快32%;
● OSVP 1X可扩展视频处理器快48%;
● OSVP 8X可扩展视频处理器快33%;
● MPVDMA多端口视频直接内存访问快71%;
● Combiner视频流合并快73%。

 

据Deepali Trehan介绍,Agilex之所以能提供超出竞品的每瓦性能,主要基于以下三方面原因:第一,基于10纳米SuperFin技术,采用第二代Hyperflex架构,基于原来14纳米的架构进行了重新设计,对于裸片面积等进行了优化,并且在重构互连和平面布局方面可以减少负载并提高可预测性,从而降低功耗、提高性能。

 

第二,在收发器设计上,采用异构Chiplet设计思路,可以针对具体的应用程序需求,适用于任何代工厂、制程节点,以及任何IP 开发商,从而达到了一定的自由度,即可以根据需求来开发具体功能;借助Chiplet模式,收发器数量不再受通道数量的限制。设计人员要增加或减少收发器通道数量,只需添加所需的收发器Chiplet即可,无需重新布局芯片以集成不同数量的通道。仅此一项,英特尔就将单个收发器通道的速度从58Gbps提升到了116Gbps。

 

第三,在软件的协同方面,通过对Quartus软件进行优化提升,并开发了多个编译流程来符合不同的开发需求,将编译时间下降了45%,同时又进行了135种Design Assistant规则,以在规则方面实现良好控制。通过这些实现快速的编译、减少在FPGA方面的迭代需求,这些都有助于用户提升生产率。

 

 

全面异构计算组合应对多样设计需求

 

作为异构集成的典型代表,Agilex提供了一个很好的案例,也进一步展示了Intel的综合实力,即先进的制程工艺(包括制程、封装技术)、编程方式,以及较为全面的半导体产品组合(包括处理器、FPGA、内存、GPU、AI加速器等)。

 

此外,在FPGA和ASIC之间,Intel还有eASIC来填补自定义逻辑统一体的空白。至于eASIC有哪些使用模式?Deepali Trehan表示,第一是降低FPGA的成本,可用于现有FPGA或新设计(可能因为上市时间或设计验证的原因而在FPGA内开始);第二是需要eASIC的低功耗和高性能优势的应用,在这个模式中,功率、散热管理或更高的性能成为关键指标,而FPGA用于设计验证或原型制作,从而加快向eASIC迁移;最后一个使用模式是FPGA和eASIC一起使用,目前这是两个单独的模块,但愿景是使用AIB把FPGA和eASIC模块封装到一起。    


在异构计算方面,Intel已经实现了较全的覆盖。对于用户来说,又该如何选择计算架构?“一切都是基于应用的,Intel提供全方位的选择和统一开发的策略”, Deepali Trehan表示,“我们已经围绕关键转折性技术建立了庞大的业务,为从边缘到云的工作负载提供广泛的计算架构,这是一个延续多年的旅程。xPU路线图让我们在市场上拥有独到优势,包括CPU、GPU、加速器和FPGA——它们通过基于行业标准的开放式编程模式oneAPI统一起来,最终帮助用户简化应用开发。”