Canyon Bridge拿下莱迪思只为FPGA?跟深度学习有几毛钱关系

2016-12-16 14:52:21 来源:EDN电子技术设计
分享到:
标签:

 

由于收购FPGA龙头老大赛灵思显然是不现实的,而行业排名第二的阿尔特拉已经被Intel以167亿美元捷足先登,因此就退而求其次收购莱迪思了,而这也已经很不容易了。

 

11月3日,莱迪思半导体与传闻中有中资背景的基金Canyon Bridge共同宣布,双方签署收购协议,Canyon Bridge将以13亿美元的价格溢价30%收购莱迪思半导体。在交易完成以后,Lattice将会继续以一间独立的子公司的身份继续运营。

 

 

目前,该交易已经被两家公司董事会一致批淮,如果通过美国相关部门审核,而且被莱迪思股东大会通过,该交易有望于2017年上半年完成。不过,22名美国国会议员在12月5日致函美国财长雅各布?卢,以安全担忧为由要求阻止与中国政府有关联的基金收购美国晶片制造商莱迪思半导体,美国国会议员在信函中说,这项交易可能扰乱美国军方的供应链,导致美国国防部许多重要计划要依赖源自国外的技术。

 

虽然这场收购是否会步中资收购德国半导体是设备厂爱思强公司的后尘还无从得知,但美国对中国政府严格的技术封锁已经展露无遗。在排除比较阴谋论的中国政府力图通过收购莱迪思获取有关FPGA的技术后,一起来看看这场收购的其他因素。

 

这场收购与深度学习的关系有多大?

相对于之前的那种比较阴谋论的观点——中国政府背后主导了这次针对莱迪思的收购,另一种观点认为这仅仅是Canyon Bridge看好FPGA在深度学习方面的发展前景。

 

在阿法狗大战李世石后,人工智能越来越多成为舆论的热点,深度学习的热度也越来越高,但芯片计算能力却成为一道瓶颈——传统的处理器是为了进行通用计算发展起来的,处理效率不高,谷歌甚至需要使用上万个中央处理器运行7天来训练一个识别猫脸的深度学习神经网络。科大讯飞曾经采用大量CPU来支持大规模数据预处理,运行GMM-HMM等经典模型的训练,在千小时的数据量下,效果也不理想。

 

因此,为了提高深度学习效率,逐渐衍生出使用CPU+GPGPU、众核芯片、CPU+FPGA和使用专门针对人工智能而开发的NPU几种方案。

 

GPGPU可以实现高并行计算和高计算吞吐,适用于计算密集、高并行、SIMD应用,尤其擅长图形图像、矩阵计算等方面的应用,英伟达的GPGPU双精浮点性能可达5.3TFlops,英伟达还专门开发的DGX-1系统,并宣称DGX-1比 21 个 Xeon Phi 服务器集群快一点,比四个 Xeon Phi 服务器集群快 5.3 倍。

 

Intel的众核芯片双精浮点性能为3 TFlops,性能功耗比为12 GFlops/W,虽然在性能上目前稍逊于GPGPU,但具有高应用适应性和易编程等多方面的特性,KNL众核处理器可以与CPU相同的编程模式、语言和优化方法,这对Intel众核处理器抢占市场有较大帮助。

 

中科院寒武纪这样的NPU是专门针对深度学习而开发的芯片,虽然在绝对性能上不输于GPGPU,在性能功耗比上亦相对于于CPU会有百倍以上的优势,但在财力和商业化能力上,无论是中科院还是新成立的寒武纪公司都和Intel、英伟达、赛灵思、阿尔特拉等国际巨头相距甚远。

 

FPGA的双精浮点性能虽然相对于英伟达的GPGPU和Intel的众核芯片要逊色不少——阿尔特拉展示的一款可以用于深度学习和科学计算的FPGA其双精浮点性能为1.5TFlops。虽然性能稍弱一些,但是性能功耗比却非常惊艳,以达到50GFlops/W,是Intel众核芯片的四倍有余,如果将FPGA用于机器学习,那么整个系统对于基于标准CPU和GPU的服务器有明显的性能功耗比优势,在大规模部署后可以大幅节省电费开销。

 

不过将FPGA用于深度学习,也存在一些不足。如果说性能功耗比是FPGA占优的一方面,那么性价比就是FPGA的劣势,FPGA可以通过编程灵活改变自己的内部逻辑的同时,也必然意味着计算资源的大量浪费。事实上如果专门开发一款和写入FPGA的电路相同的芯片,同产量理论成本只有FPGA的几分之一。也就是说保守估计,相同的性能FPGA的成本要高几倍。事实上,目前FPGA只用于小规模产品或测试性质的验证中以规避流片的风险。随着芯片复杂程度的提高,芯片面积的增大这个问题还会越来越突出。这也是FPGA诞生那么多年来一直“养在深闺人未识”的重要原因。

 

FPGA是否能从此走向“深度学习”也是未知数——人的大脑是串行为主的思维模式,而且人类大脑的开发是相对有限的,有很大的开发潜力,而FPGA是并行化很高的元件,而且硬件资源是有限的。另外,培养一个FPGA编程工程师比培养一个编写应用软件的工程师难度大多了,如果采用FPGA自己编写自己的软件的话,实在过于富有想象力——人不善于解决的问题就交给电脑去解决,这非常符合人类逻辑,但是未必符合机器的规律。AMD一位工程师曾经提到过即使是最先进的自动设计软件进行电路设计也总是比人手工设计的芯片面积大20%,同时还慢20%......

 

即便存在一些不足,CPU+FPGA依旧有应用于深度学习的潜力,如果CPU+FPGA异构计算技术如果在机器学习上成为主流,那么FPGA的市场规模将会进一步扩大。

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
阿里云选择Xilinx部署FPGA云加速服务F2

All Programmable技术和器件的全球领先企业赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))今天在2017杭州·云栖大会上宣布,阿里巴巴旗下云计算公司阿里云在其最新款的FPGA加速服务中选择了赛灵思。

降低 TCO 的同时提高数据中心性能:使用 FPGA 实现多用途应用加速
降低 TCO 的同时提高数据中心性能:使用 FPGA 实现多用途应用加速

对于各种不同的数据中心工作负载,FPGA 可以显著提高性能,最大程度减少附加功耗并降低总体拥有成本 (TCO)。

英特尔简化 FPGA 加速应用:将平台、软件堆栈和生态系统解决方案相结合
英特尔简化 FPGA 加速应用:将平台、软件堆栈和生态系统解决方案相结合

今天,英特尔推出一款完备的硬件和软件平台解决方案,旨在加快实现基于现场可编程门阵列 (FPGA) 的定制化的网络、存储和计算工作负载加速。

FPGA是市场宠儿?Efinix叫嚣着要“闹革命”

上世纪中叶开始,半导体行业随着摩尔定律呈指数状发展。随着摩尔定律,每过18个月芯片集成度翻一番,导致芯片平均成本快速下降;同时,随着特征尺寸变小,芯片上晶体管的性能也随着摩尔定律快速上升。

莱迪思携手Helion推出开箱即用的ISP解决方案
莱迪思携手Helion推出开箱即用的ISP解决方案

2017年10月2日 — 莱迪思半导体公司(NASDAQ: LSCC),客制化智能互连解决方案市场的领先供应商,今日与HelionVision®共同宣布推出最新的解决方案,加速嵌入式视觉应用设计和原型开发。

更多资讯
实现模拟和数字高度集成的单芯片设计,RFSoC在5G时代大有可为

5G通信以高宽带、高速度传输等优势让大众寄托了无限期待,运营商、设备商、方案商都在围绕5G展开方案设计、产品研发、通信基站搭建等前期工作,虽然5G标准还未发布,但是产业链上下游的合力推动将加快5G通信的商用步伐,用户也会更早

高云半导体推出GW2A系列FPGA芯片的DDR类储存器接口解决方案
高云半导体推出GW2A系列FPGA芯片的DDR类储存器接口解决方案

山东济南,2017年10月10日讯,山东高云半导体科技有限公司(以下简称“山东高云半导体”)今天宣布推出基于中密度晨熙Ⓡ家族的GW2A系列FPGA芯片的DDR类储存器接口IP核初级版(Gowin Memory Interface IP),包括相关IP软核、参考设计及开发板等完整解决方案。

Xilinx宣布集成RF信号链的Zynq UltraScale+RFSoC系列开始发货
Xilinx宣布集成RF信号链的Zynq UltraScale+RFSoC系列开始发货

All Programmable技术和器件的全球领先企业赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))今天宣布其Zynq UltraScale+ RFSoC系列开始发货,该系列是通过一个突破性的架构将RF信号链集成在一个单芯片SoC中,致力于加速5G无线、有线Remote-PHY及其它应用的实现。

Ximmerse VR/AR跟踪平台采用莱迪思的低功耗、小尺寸ECP5 FPGA

莱迪思半导体公司(NASDAQ: LSCC),客制化智能互连解决方案市场的领先供应商,今日宣布广东虚拟现实科技有限公司(Ximmerse),移动AR/VR应用交互系统提供商,选择采用莱迪思ECP5™ FPGA为其AR/VR跟踪平台实现立体视觉计算解决方案。

中资收购Lattice被拒,美国媒体居然这么说

中资收购Lattice被美国外国投资审查委员会(CFIUS)否定后,有美国媒体撰文表达了对这件事及其后续影响的看下,与非网小编将内容整理如下

微话题

工作 or 考研?

又到一年招聘季,考研or工作让你实现了怎样的逆袭?……