【技术分享】英特尔10纳米Agilex FPGA核心技术全解读

2019-04-17 15:02:14 来源: FPGA创新中心
标签:

从 Falcon Mesa 到 Agile

英特尔的10纳米FPGA终于来了。在四月刚刚结束的英特尔“以数据为中心创新日”中,曾经代号为Falcon Mesa的英特尔最新一代10纳米FPGA正式亮相,并正式命名为Agilex™。

 


(图片来自英特尔)

 

在本文中,老石将对Agilex的六大核心技术做全面的深入解读。

 

灵活+敏捷=Agilex™ FPGA

Agilex是Agile(敏捷)和Flexible(灵活)的合二为一,而这两个特点正是现代FPGA技术最为核心的两大要点。

 

具体来说,“灵活性”就是指可编程性,它基于FPGA的核心技术——可编程逻辑阵列,可以灵活的针对不同应用场景进行编程,并改变FPGA的逻辑结构和功能。

 

“敏捷性”指的是异构,它既可以是不同逻辑单元之间的异构,也可以是不同工艺的异构,或者两者兼而有之。如下图所示,不同类型的IP所对应的成熟工艺与迭代时间都不尽相同。只有采用异构架构,才能充分发挥不同IP和不同工艺节点的优势,取长补短,在性能和成本上取得良好的平衡。因此异构FPGA也是目前和未来业界发展和研究的主要方向。

 


(图片来自英特尔)

 

在这个大背景下,Agilex™ FPGA应运而生。它既包含了传统FPGA灵活的可编程性,又结合了现代FPGA基于异构架构的敏捷性,因此能够同时适用于众多应用领域,并针对性的进行配置和快速迭代,如下图所示。

 


(图片来自英特尔)

 

与进化多年的Stratix®、Arria®、Cyclone®、Max® 等FPGA产品系列相比,Agilex™ 是原FPGA巨头Altera在2015年底被英特尔收购、并成为其可编程方案事业部(PSG)后正式推出的一个全新的FPGA系列。正因如此,Agilex™ 无疑被英特尔寄予了更多的期待。

 

在这些期待背后,离不开来自英特尔的核心技术的加持。而这也将是区分Agilex™ 与它的前代产品、以及其他竞争对手的最主要的优势。具体来说,Agilex™ 遗传自英特尔的核心竞争优势有以下六点。

 

1、英特尔10纳米工艺

英特尔在半导体领域称雄几十年,靠的就是两个独门绝技:第一是众所周知的x86架构,第二则是曾经遥遥领先竞争对手的半导体制造工艺。这也促成了英特尔著名的“Tick-Tock”战略,即架构和工艺的更新逐年交错进行,同时还能保持处理器性能的稳步增长。

 

不过,这家芯片巨头在10纳米工艺上遇到了阻碍。事实上,英特尔也曾预测10纳米的研发会比之前耗时更久,如下图所示,但可能没有人想到会是这么久。

 


(图片来自英特尔)

 

结果是,就在过去的一两年中,曾经被远远甩在身后的竞争者纷纷在十纳米这个工艺节点完成了超车,台积电和三星都逐渐将自家的十纳米工艺投入量产。

 

终于,2019年初痛定思痛的英特尔一口气发布了四款基于10纳米工艺的芯片产品,涵盖了个人计算平台、数据中心、5G网络等多个应用领域,并将最快于年底正式出货量产。而这次发布的Agilex™ FPGA,也正是基于英特尔10纳米工艺的旗舰级FPGA产品。

 

对于芯片制程而言,在相同的工艺节点下,英特尔的工艺往往具有更优异的性能,这也是业界公认的事实。一旦英特尔的十纳米工艺达到稳定并量产,预计将会比竞争对手带来20%-30%的性能和功耗优势,如下图所示。

 


(图片来自英特尔)

 

2、系统级3D芯片

系统级3D芯片的异构集成和封装,也是英特尔的独门秘籍之一。这其中主要有两个主要技术,一个是EMIB(嵌入式多管芯互联桥接),用于提供多个异构晶片的高速互连;另一个则是2019年最新公布的Foveros 3D封装技术。

 

在Agilex™ FPGA中,使用了第二代EMIB技术,用以连接可编程逻辑阵列以及周围的各类子芯片集(Chiplets)。由于EMIB不需要引入额外的硅中介层,因此不需要大量的硅通孔,这样显著降低了系统的制造复杂度。同时不需要在中介层中使用长导线,因此降低了不同晶片间的传输延时,减少了信号的传输干扰。另外,在替换不同的子芯片集时更加容易,而无需重做整个芯片系统。

 


(图片来自英特尔)

 

3、CXL:CPU与FPGA互连的终极方案

当前,FPGA的一个主要应用场景是在数据中心里作为CPU的硬件加速器,用来加速各类应用,如深度学习的模型训练、金融计算、网络功能卸载等等。

 

在数据中心的CPU领域,英特尔的Xeon® CPU一直是绝对的最强王者。作为数据中心加速器的FPGA,首先需要考虑的就是与Xeon® CPU的兼容性问题。很明显,作为具有“纯正血统”的Agilex™ FPGA,从出生伊始就相比竞争对手占据了天时和地利。

 

缓存一致性问题一直是硬件加速器领域亟需解决的核心问题之一。而解决这个问题的主要方法,就是明确和普及CPU与硬件加速器之间的内存互联协议,就好比大家熟知的用于CPU和加速器通信的PCIe协议等等。

 

在今年3月,英特尔宣布联合微软、阿里、思科、戴尔EMC、Facebook、谷歌、惠普企业HPE和华为等公司,共同组件一个全新的互联标准,名为Compute Express Link – CXL,如下图所示。

 


有趣的是,CXL的发起者中有四个互联网巨头、两个服务器设备制造商、两个网络设备制造商。这种多元性立体的呈现了CXL的目标应用领域:互联网数据中心、通信基础设施、云计算与云服务等等。而这些领域也正是FPGA大显身手的重要平台。

 

对于Agilex™ FPGA,它将原生支持CXL协议,并将成为业界首款面向Xeon® 可扩展处理器的内存一致性硬件加速器。值得注意的是,CXL协议基于PCIe设计和扩展,如下图所示,这样可以完全复用PCIe PHY和通道,与其他类似的协议相比有着明显的易用性。

 


因此,Agilex™ 对CXL的原生支持,势必会在“天时”和“地利”的基础上,为它在数据中心的广泛使用带来巨大的“人和”优势。

 


(图片来自英特尔)

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
FPGA近期频频刷“存在感”,它究竟有什么特别之处?

日前赛灵思推出最大容量FPGA芯片,阿里达摩院也发布了关于AI语音的FPGA芯片技术。FPGA芯片有何特别之处?它和当下最热的5G、AI领域又有何关系呢?据媒体报道,全球最大的可编程芯片(FPGA)厂

什么是“机密计算”?为何微软、IBM、英特尔、阿里巴巴、腾讯等都在布局?

一大批大型科技公司将为Linux Foundation主导的新计划提供支持,该计划旨在促进“机密计算”概念也就是在使用时对数据进行加密。

将Power指令集开源,IBM 是如何咸鱼翻身的?

这是一个漫长的过程,如果在十年前就这样做,情况可能会更好。但是,随着收购Red Hat后大量注入开源精神,IBM终于迈出了下一步,将其Power系列处理器的指令集体系结构开源。

快速掌握MIPI开发攻略,对接百度人工智能计算卡EdgeBoard

MIPI(移动行业处理器接口)是Mobile Industry Processor Interface的缩写,是MIPI联盟发起的为移动应⽤处理器制定的开放标准。

英特又“挤牙膏”?最新一代酷睿用14nm工艺
英特又“挤牙膏”?最新一代酷睿用14nm工艺

英特尔对移动 PC 处理器的更新仍在继续,今天,英特尔带来了第二批面向轻薄本和二合一设备的第 10 代 Comet Lake 移动处理器。

更多资讯
基于Verilog的UART接口电路设计
基于Verilog的UART接口电路设计

UART(UniversalAnynchrONousReceiverTransmitter,通用异步接收发送器)是广泛应用的串行数据传输协议之一,其应用范围遍及计算机外设、工控自动化等场合。

使用FPGA加速广告推荐算法的教程

在这篇文章里你可以了解到广告推荐算法 Wide and deep 模型的相关知识和搭建方法,还能了解到模型优化和评估的方式。我还为你准备了将模型部署到 FPGA 上做硬件加速的方法,希望对你有帮助。阅读这篇文章你可能需要 20 分钟的时间。

IBM宣布开源Power架构,国产处理器的另一个机会?
IBM宣布开源Power架构,国产处理器的另一个机会?

在正在进行的北美 OpenPOWER 峰会上,IBM 宣布开源 Power 芯片指令集架构(ISA,Instruction Set Architecture)。

继世界最大AI芯片诞生后,赛灵思发布最大FPGA芯片
继世界最大AI芯片诞生后,赛灵思发布最大FPGA芯片

赛灵思(Xilinx)今天宣布推出世界最大的FPGA芯片“Virtex UltraScale+ VU19P”,拥有多达350亿个晶体管,密度在同类产品中也是最大的,相比上代Virtex UltraScale VU440增大了1.6倍,而功耗降低了60%。

Xilinx推出拥有900万个系统逻辑单元的全球最大 FPGA

自适应和智能计算的全球领先企业赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))今天宣布推出全球最大容量的 FPGA – Virtex UltraScale+ VU19P,从而进一步扩展了旗下 16 纳米 (nm) Virtex® UltraScale+™ 产品系列。