英特尔在 2015 年以 167 亿美元的价格收购 Altera 时,公司官员预测,到 2020 年,多达三分之一的服务器将配备 FPGA。尽管这种情况不太可能发生,但它不会削减英特尔在数据中心和其他地方对 FPGA 的野心。

 

为什么英特尔的野心不改?在过去四年中,英特尔凭借其 FPGA 产品部署了一些值得注意的成功案例,最引人注目的可能是微软接纳了 Project Catapult 技术。这项技术为在整个 Azure 云中部署英特尔 FPGA 奠定了基础,这些设备用于加速从 Bing 搜索到网络服务的所有内容。

 

最近,英特尔透露日本互联网服务提供商乐天(Rakuten)正在使用英特尔 FPGA 通过其移动网络加速语音和视频数据。在边缘计算领域,NEC 正在利用 Arria 10 FPGA 为 NeoFace 提供算力支持,NeoFace 是一个人脸识别引擎,有着非常广泛的应用场景。

 

值得注意的是,所有这些用例都是英特尔 FGPA 与 Xeon 处理器协同工作的,这是该芯片制造商自收购 Altera 以来常用的一个组合。英特尔最初的 Xeon-FGPA 混合产品非常有吸引力,但没有出现任何商业化的迹象。

 

直到本周。

 

 

被称为 AgileX 的新产品系列似乎就是 Xeon-FPGA 的混合体。实际上,Xeon 处理器看上去像是平台的附件,它们共享缓存,而不是作为集成组件存在。我们马上就会谈到这一点,在我们分解平台的各个部分之前,我们先来了解英特尔已应用到到架构中的各种技术。

 

从本质上讲,AgileX 是一个异构的逻辑存储器和接口包,可以将 FPGA 内核(包括可配置的 DSP 和可选的 Arm SoC)与 Xeon 处理器,定制芯片(实际上是小芯片)和 I / O 设备连接起来。FPGA 和其他组件之间的连接是通过英特尔的嵌入式多芯片互连桥接器(EMIB)实现的,该技术旨在将单个封装内的不同芯片连接在一起。

 

毫无疑问,FPGA 部件将使用英特尔的 10nm 工艺节点制造,与目前的 Stratix 10 FPGA 相比,性能提升 40%,而功耗则降低 40%。目前尚不清楚这种更好的性能和效率有多少归功于强化的 DSP,但看起来这个组件已经进行了升级。

 

根据英特尔的说法,AgileX DSP 提供高达 40 个 16 比特的峰值万亿次浮点运算性能,并支持 FP32,bfloat16,FP16 和 INT8 数字格式。它还可以配置为支持较低精度的整数 - INT7 到 INT2 之间的任何值。英特尔表示,这是第一款支持硬化 bfloat16 和 FP16 的 FPGA。鉴于这些格式,我们可以看出英特尔的目标非常明确,就是要将 FPGA 应用于推理经过训练的神经网络。

 

正如我们所提到的,AgileX 设备可以连接到 Xeon 处理器,通过缓存一致的 UltraPath Interconnect(UPI)链接实现连接,允许 FGPA 和 Xeon 存储器共享相同的地址空间。这里解释一下 UPI,UPI 是 2017 年夏天在 Skylake Xeon SP 处理器中引入的 QPI 的更高效和更快(10.4 GT / sec)的替代品,它在 Agilex 中的存在体现了英特尔希望 FPGA 可以充当 CPU 的真正对等体,而不仅仅是挂在 PCI-Express 总线上的协处理器。

 

对于更专业的处理,AgileX 设备还可以连接来自英特尔和第三方提供商的定制芯片。英特尔提出的一项关键技术是 eASIC,这项技术就是英特尔收购的 eASIC 这家公司的技术。

 

它可以将可配置的逻辑块转换为 FPGA 和 ASIC 之间的中间件。根据英特尔的说法,eASIC“提供更接近标准单元 ASIC 的性能和功效,但设计时间更短,而且与 ASIC 相关的非经常性工程成本的一小部分。”声称它可以提供在短短五周内测试原型。鉴于此,我们感觉 eASIC 技术将在不久的将来在其他英特尔产品中亮相。

 

异构性也扩展到 AgileX 内存和 I / O 上,该平台支持 DDR4,DDR5 和高带宽内存(HBM),以及英特尔自己的 Optane DC 持续性内存,而设备连接则由 PCI-Express 4.0 或 5.0 提供。还提供 112G SerDes 收发器接口,其中四个通道足以提供 400 Gb /s 的网络链路。

 

AgileX 产品系列分为 F 系列,I 系列和 M 系列,下图显示了每个系列中可用的各种界面和选项,按照字母排序,功能依次增加。

 

 

细分还反映了 AgileX 所针对的各种环境:从超大规模云和企业数据中心到边缘和嵌入式空间。请注意,应用程序集与今天 GPU 正在应用的许多领域重叠,我们也非常好奇,英特尔将如何定位即将在 2020 年推出的即将推出的 X e  分立 GPU,也许 X e 小芯片选项正在开发中。

 

我们免不了将 AgileX 与去年推出的 Xilinx 自适应计算加速平台(ACAP)进行比较。与 AgileX 一样,ACAP 作为异构软件包实现,以 FPGA 为基础,旨在为数据中心和边缘环境中的各种工作负载提供以数据为中心的平台。但是 AgileX 引入了许多本土的英特尔技术,Xilinx 难以重现这些技术。这将成为未来几年有趣的竞争,因为两家公司都在改进产品并在各自的技术和专业知识方面发挥各自的优势。

 

与此同时,英特尔必须将客户和第三方 IP 提供商吸引到 AgileX 中。这是从 4 月份开始的,当时公司计划让选定的用户尽早访问 AgileX 硬件和开发工具,英特尔计划在今年第三季度公布这项技术。

 

与非网编译内容,未经许可,不得转载!