英特尔AgileX如何与赛灵思的ACAP相抗衡?

2019-04-09 09:36:00 来源:EEFOCUS
标签:

英特尔在2015年以167亿美元的价格收购Altera时,公司官员预测,到2020年,多达三分之一的服务器将配备FPGA。尽管这种情况不太可能发生,但它不会削减英特尔在数据中心和其他地方对FPGA的野心。

 

为什么英特尔的野心不改?在过去四年中,英特尔凭借其FPGA产品部署了一些值得注意的成功案例,最引人注目的可能是微软接纳了Project Catapult技术。这项技术为在整个Azure云中部署英特尔FPGA奠定了基础,这些设备用于加速从Bing搜索到网络服务的所有内容。

 

最近,英特尔透露日本互联网服务提供商乐天(Rakuten)正在使用英特尔FPGA通过其移动网络加速语音和视频数据。在边缘计算领域,NEC正在利用Arria 10 FPGA为NeoFace提供算力支持,NeoFace是一个人脸识别引擎,有着非常广泛的应用场景。

 

值得注意的是,所有这些用例都是英特尔FGPA与Xeon处理器协同工作的,这是该芯片制造商自收购Altera以来常用的一个组合。英特尔最初的Xeon-FGPA混合产品非常有吸引力,但没有出现任何商业化的迹象。

 

直到本周。

 

 

被称为AgileX的新产品系列似乎就是Xeon-FPGA的混合体。实际上,Xeon处理器看上去像是平台的附件,它们共享缓存,而不是作为集成组件存在。我们马上就会谈到这一点,在我们分解平台的各个部分之前,我们先来了解英特尔已应用到到架构中的各种技术。

 

从本质上讲,AgileX是一个异构的逻辑存储器和接口包,可以将FPGA内核(包括可配置的DSP和可选的Arm SoC)与Xeon处理器,定制芯片(实际上是小芯片)和I / O设备连接起来。FPGA和其他组件之间的连接是通过英特尔的嵌入式多芯片互连桥接器(EMIB)实现的,该技术旨在将单个封装内的不同芯片连接在一起。

 

毫无疑问,FPGA部件将使用英特尔的10nm工艺节点制造,与目前的Stratix 10 FPGA相比,性能提升40%,而功耗则降低40%。目前尚不清楚这种更好的性能和效率有多少归功于强化的DSP,但看起来这个组件已经进行了升级。

 

根据英特尔的说法,AgileX DSP提供高达40个16比特的峰值万亿次浮点运算性能,并支持FP32,bfloat16,FP16和INT8数字格式。它还可以配置为支持较低精度的整数 - INT7到INT2之间的任何值。英特尔表示,这是第一款支持硬化bfloat16和FP16的FPGA。鉴于这些格式,我们可以看出英特尔的目标非常明确,就是要将FPGA应用于推理经过训练的神经网络。

 

正如我们所提到的,AgileX设备可以连接到Xeon处理器,通过缓存一致的UltraPath Interconnect(UPI)链接实现连接,允许FGPA和Xeon存储器共享相同的地址空间。这里解释一下UPI,UPI是2017年夏天在Skylake Xeon SP处理器中引入的QPI的更高效和更快(10.4 GT / sec)的替代品,它在Agilex中的存在体现了英特尔希望FPGA可以充当CPU的真正对等体,而不仅仅是挂在PCI-Express总线上的协处理器。

 

对于更专业的处理,AgileX设备还可以连接来自英特尔和第三方提供商的定制芯片。英特尔提出的一项关键技术是eASIC,这项技术就是英特尔收购的eASIC这家公司的技术。

 

它可以将可配置的逻辑块转换为FPGA和ASIC之间的中间件。根据英特尔的说法,eASIC“提供更接近标准单元ASIC的性能和功效,但设计时间更短,而且与ASIC相关的非经常性工程成本的一小部分。”声称它可以提供在短短五周内测试原型。鉴于此,我们感觉eASIC技术将在不久的将来在其他英特尔产品中亮相。

 

异构性也扩展到AgileX内存和I / O上,该平台支持DDR4,DDR5和高带宽内存(HBM),以及英特尔自己的Optane DC持续性内存,而设备连接则由PCI-Express 4.0或5.0提供。还提供112G SerDes收发器接口,其中四个通道足以提供400 Gb /s的网络链路。

 

AgileX产品系列分为F系列,I系列和M系列,下图显示了每个系列中可用的各种界面和选项,按照字母排序,功能依次增加。

 

 

细分还反映了AgileX所针对的各种环境:从超大规模云和企业数据中心到边缘和嵌入式空间。请注意,应用程序集与今天GPU正在应用的许多领域重叠,我们也非常好奇,英特尔将如何定位即将在2020年推出的即将推出的X e  分立GPU,也许X e小芯片选项正在开发中。

 

我们免不了将AgileX与去年推出的Xilinx自适应计算加速平台(ACAP)进行比较。与AgileX一样,ACAP作为异构软件包实现,以FPGA为基础,旨在为数据中心和边缘环境中的各种工作负载提供以数据为中心的平台。但是AgileX引入了许多本土的英特尔技术,Xilinx难以重现这些技术。这将成为未来几年有趣的竞争,因为两家公司都在改进产品并在各自的技术和专业知识方面发挥各自的优势。

 

与此同时,英特尔必须将客户和第三方IP提供商吸引到AgileX中。这是从4月份开始的,当时公司计划让选定的用户尽早访问AgileX硬件和开发工具,英特尔计划在今年第三季度公布这项技术。

 

与非网编译内容,未经许可,不得转载!

 
 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
与非网 记者
与非网 记者

电子行业垂直媒体--与非网记者一枚,愿从海量行业资讯中淘得几粒金沙,与你分享!

继续阅读
FPGA近期频频刷“存在感”,它究竟有什么特别之处?

日前赛灵思推出最大容量FPGA芯片,阿里达摩院也发布了关于AI语音的FPGA芯片技术。FPGA芯片有何特别之处?它和当下最热的5G、AI领域又有何关系呢?据媒体报道,全球最大的可编程芯片(FPGA)厂

什么是“机密计算”?为何微软、IBM、英特尔、阿里巴巴、腾讯等都在布局?

一大批大型科技公司将为Linux Foundation主导的新计划提供支持,该计划旨在促进“机密计算”概念也就是在使用时对数据进行加密。

将Power指令集开源,IBM 是如何咸鱼翻身的?

这是一个漫长的过程,如果在十年前就这样做,情况可能会更好。但是,随着收购Red Hat后大量注入开源精神,IBM终于迈出了下一步,将其Power系列处理器的指令集体系结构开源。

快速掌握MIPI开发攻略,对接百度人工智能计算卡EdgeBoard

MIPI(移动行业处理器接口)是Mobile Industry Processor Interface的缩写,是MIPI联盟发起的为移动应⽤处理器制定的开放标准。

英特又“挤牙膏”?最新一代酷睿用14nm工艺
英特又“挤牙膏”?最新一代酷睿用14nm工艺

英特尔对移动 PC 处理器的更新仍在继续,今天,英特尔带来了第二批面向轻薄本和二合一设备的第 10 代 Comet Lake 移动处理器。

更多资讯
基于Verilog的UART接口电路设计
基于Verilog的UART接口电路设计

UART(UniversalAnynchrONousReceiverTransmitter,通用异步接收发送器)是广泛应用的串行数据传输协议之一,其应用范围遍及计算机外设、工控自动化等场合。

使用FPGA加速广告推荐算法的教程

在这篇文章里你可以了解到广告推荐算法 Wide and deep 模型的相关知识和搭建方法,还能了解到模型优化和评估的方式。我还为你准备了将模型部署到 FPGA 上做硬件加速的方法,希望对你有帮助。阅读这篇文章你可能需要 20 分钟的时间。

IBM宣布开源Power架构,国产处理器的另一个机会?
IBM宣布开源Power架构,国产处理器的另一个机会?

在正在进行的北美 OpenPOWER 峰会上,IBM 宣布开源 Power 芯片指令集架构(ISA,Instruction Set Architecture)。

继世界最大AI芯片诞生后,赛灵思发布最大FPGA芯片
继世界最大AI芯片诞生后,赛灵思发布最大FPGA芯片

赛灵思(Xilinx)今天宣布推出世界最大的FPGA芯片“Virtex UltraScale+ VU19P”,拥有多达350亿个晶体管,密度在同类产品中也是最大的,相比上代Virtex UltraScale VU440增大了1.6倍,而功耗降低了60%。

Xilinx推出拥有900万个系统逻辑单元的全球最大 FPGA

自适应和智能计算的全球领先企业赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))今天宣布推出全球最大容量的 FPGA – Virtex UltraScale+ VU19P,从而进一步扩展了旗下 16 纳米 (nm) Virtex® UltraScale+™ 产品系列。