Canyon Bridge拿下莱迪思只为FPGA?跟深度学习有几毛钱关系

2016-12-16 14:52:21 来源:EDN电子技术设计
分享到:
标签:

 

由于收购FPGA龙头老大赛灵思显然是不现实的,而行业排名第二的阿尔特拉已经被Intel以167亿美元捷足先登,因此就退而求其次收购莱迪思了,而这也已经很不容易了。

 

11月3日,莱迪思半导体与传闻中有中资背景的基金Canyon Bridge共同宣布,双方签署收购协议,Canyon Bridge将以13亿美元的价格溢价30%收购莱迪思半导体。在交易完成以后,Lattice将会继续以一间独立的子公司的身份继续运营。

 

 

目前,该交易已经被两家公司董事会一致批淮,如果通过美国相关部门审核,而且被莱迪思股东大会通过,该交易有望于2017年上半年完成。不过,22名美国国会议员在12月5日致函美国财长雅各布?卢,以安全担忧为由要求阻止与中国政府有关联的基金收购美国晶片制造商莱迪思半导体,美国国会议员在信函中说,这项交易可能扰乱美国军方的供应链,导致美国国防部许多重要计划要依赖源自国外的技术。

 

虽然这场收购是否会步中资收购德国半导体是设备厂爱思强公司的后尘还无从得知,但美国对中国政府严格的技术封锁已经展露无遗。在排除比较阴谋论的中国政府力图通过收购莱迪思获取有关FPGA的技术后,一起来看看这场收购的其他因素。

 

这场收购与深度学习的关系有多大?

相对于之前的那种比较阴谋论的观点——中国政府背后主导了这次针对莱迪思的收购,另一种观点认为这仅仅是Canyon Bridge看好FPGA在深度学习方面的发展前景。

 

在阿法狗大战李世石后,人工智能越来越多成为舆论的热点,深度学习的热度也越来越高,但芯片计算能力却成为一道瓶颈——传统的处理器是为了进行通用计算发展起来的,处理效率不高,谷歌甚至需要使用上万个中央处理器运行7天来训练一个识别猫脸的深度学习神经网络。科大讯飞曾经采用大量CPU来支持大规模数据预处理,运行GMM-HMM等经典模型的训练,在千小时的数据量下,效果也不理想。

 

因此,为了提高深度学习效率,逐渐衍生出使用CPU+GPGPU、众核芯片、CPU+FPGA和使用专门针对人工智能而开发的NPU几种方案。

 

GPGPU可以实现高并行计算和高计算吞吐,适用于计算密集、高并行、SIMD应用,尤其擅长图形图像、矩阵计算等方面的应用,英伟达的GPGPU双精浮点性能可达5.3TFlops,英伟达还专门开发的DGX-1系统,并宣称DGX-1比 21 个 Xeon Phi 服务器集群快一点,比四个 Xeon Phi 服务器集群快 5.3 倍。

 

Intel的众核芯片双精浮点性能为3 TFlops,性能功耗比为12 GFlops/W,虽然在性能上目前稍逊于GPGPU,但具有高应用适应性和易编程等多方面的特性,KNL众核处理器可以与CPU相同的编程模式、语言和优化方法,这对Intel众核处理器抢占市场有较大帮助。

 

中科院寒武纪这样的NPU是专门针对深度学习而开发的芯片,虽然在绝对性能上不输于GPGPU,在性能功耗比上亦相对于于CPU会有百倍以上的优势,但在财力和商业化能力上,无论是中科院还是新成立的寒武纪公司都和Intel、英伟达、赛灵思、阿尔特拉等国际巨头相距甚远。

 

FPGA的双精浮点性能虽然相对于英伟达的GPGPU和Intel的众核芯片要逊色不少——阿尔特拉展示的一款可以用于深度学习和科学计算的FPGA其双精浮点性能为1.5TFlops。虽然性能稍弱一些,但是性能功耗比却非常惊艳,以达到50GFlops/W,是Intel众核芯片的四倍有余,如果将FPGA用于机器学习,那么整个系统对于基于标准CPU和GPU的服务器有明显的性能功耗比优势,在大规模部署后可以大幅节省电费开销。

 

不过将FPGA用于深度学习,也存在一些不足。如果说性能功耗比是FPGA占优的一方面,那么性价比就是FPGA的劣势,FPGA可以通过编程灵活改变自己的内部逻辑的同时,也必然意味着计算资源的大量浪费。事实上如果专门开发一款和写入FPGA的电路相同的芯片,同产量理论成本只有FPGA的几分之一。也就是说保守估计,相同的性能FPGA的成本要高几倍。事实上,目前FPGA只用于小规模产品或测试性质的验证中以规避流片的风险。随着芯片复杂程度的提高,芯片面积的增大这个问题还会越来越突出。这也是FPGA诞生那么多年来一直“养在深闺人未识”的重要原因。

 

FPGA是否能从此走向“深度学习”也是未知数——人的大脑是串行为主的思维模式,而且人类大脑的开发是相对有限的,有很大的开发潜力,而FPGA是并行化很高的元件,而且硬件资源是有限的。另外,培养一个FPGA编程工程师比培养一个编写应用软件的工程师难度大多了,如果采用FPGA自己编写自己的软件的话,实在过于富有想象力——人不善于解决的问题就交给电脑去解决,这非常符合人类逻辑,但是未必符合机器的规律。AMD一位工程师曾经提到过即使是最先进的自动设计软件进行电路设计也总是比人手工设计的芯片面积大20%,同时还慢20%......

 

即便存在一些不足,CPU+FPGA依旧有应用于深度学习的潜力,如果CPU+FPGA异构计算技术如果在机器学习上成为主流,那么FPGA的市场规模将会进一步扩大。

 

继续阅读
想让机器人更智能,就教它FPGA和CPU开发
想让机器人更智能,就教它FPGA和CPU开发

能够暴力弹跳的复杂机械装置?各类价格昂贵的传感器?或像EVE那样以萌神外形征服世界?

如何利用FPGA进行时序分析设计
如何利用FPGA进行时序分析设计

FPGA(Field-Programmable Gate Array),即现场可编程门阵列,它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。对于时序如何用FPGA来分析与设计,本文将详细介绍。

深度学习触发AI革命,AI+安防最先布局
深度学习触发AI革命,AI+安防最先布局

人工智能的发展可以追述到60几年前,但是因为技术的原因数次沉寂,直到深度学习的出现,让人工智能再次掀起热潮。

轻松击破基于SRAM的FPGA,黑客破解MCU招式不要太多
轻松击破基于SRAM的FPGA,黑客破解MCU招式不要太多

这篇文章是俄国人Sergei P.Skorobogatov就读英吉利剑桥大学之博士论文,讲解了各种MCU的攻防技术,堪称一部小百科全书。对于志在研究MCU防护的筒子,能给你很多参考思路:但对于想当黑客的人,我们对后果概不负责。

Achronix的eFPGA距离成为FPGA领域的ARM还差几步?
Achronix的eFPGA距离成为FPGA领域的ARM还差几步?

一种可能改变FPGA游戏规则的产品已经出现,那就是嵌入式FPGA(eFPGA),这种产品也许会上面的预测数据出现更大改观。“我们在去年推出的Speedcore嵌入式加速器FPGA IP产品具有超高带宽和超低延迟的特点,更适用于硬件加速器这一市场。有赖于采用这一产品的客户今年将实现量产,Achronix公司今年的营收将超过1亿美元。”

更多资讯
Synopsys的完整CCIX IP解决方案支持高性能云计算SoC实现缓存一致性

新思科技(Synopsys, Inc.,纳斯达克股票代码:SNPS)日前宣布:即日起推出整套DesignWare® CCIX IP解决方案,该解决方案包括控制器、PHY和验证IP,提供高达25Gbps的数据传输速度并支持高性能云计算应用实现缓存一致性。

Achronix的2017年营业收入将比上年增长7倍并将超过1亿美元

Achronix Semiconductor公司(Achronix Semiconductor Corporation)今日宣布:其2017年的营业收入将比上年增长7倍并将超过1亿美元。Achronix的超快速成长主要来自于其Speedster22i系列现场可编程门阵列(FPGA)产品的销售,以及其Speedcore 嵌入式FPGA

Lattice这只到嘴的鸭子要飞,美国又要对中资收购说不?

美国政府正在衡量半导体芯片公司Lattice的出售是否会对美国的国家安全产生影响。尤其是在这笔收购的买方,虽然是一家硅谷的私募股权公司,但是这笔交易的背后却是来自于北京的资本。

莱迪思新一代FPGA将采用FD-SOI工艺以强化差异化竞争

可编程逻辑或者说FPGA(现场可编程门阵列)的发展出现两极化,一种是大而全,一种是小而美。莱迪思(Lattice)半导体走上了后面一条路,追求低功耗、小尺寸和低成本。在2015年购入Silicon Image以后,莱迪思又具备了主要面向视频应用的有线与无线连接技术。如今,籍由可编程逻辑、视频互连以及毫米波技术组成的智能互联解决方案三驾马车

莱迪思ECP5™ FPGA助力实现低功耗网络边缘嵌入式视觉系统

莱迪思半导体公司(NASDAQ: LSCC),客制化智能互连解决方案市场的领先供应商,今日宣布旗下ECP5 FPGA解决方案已被应用于智能监控和汽车领域中的网络边缘嵌入式视觉应用。

微话题

第三届“工程师节”

心动指数爆表的礼品 ……
Moore8直播课堂
STM32快速开发笔记——随机数发生器之RNG

STM32快速开发笔记——随机数发生器之RNG

2017-06-25 21:00:00
以前,嵌入式MCU功能简单、种类较少,软件开发起来相对容易,而今天,MCU功能强大、种类繁多,软件中实现的功能也要比以前更多更复杂。该系列课程,针对基于ARM的STM32 MCU,将利用STM32cu
恩智浦技术日直播——数字网络解决方案

恩智浦技术日直播——数字网络解决方案

2017-06-28 09:00:00
MAPS开发套件、S32K144、LPC54110,NXP的这场直播除了干货外还有超多福利放送!据美国知名分析机构IHS预测,2020年,全球物联网设备将达到307亿。如此爆发性的增长对物联网设备开发
深度学习单层网络系统的构建

深度学习单层网络系统的构建

2017-07-01 20:00:00
鉴于在深度学习加速方面的独特优势,FPGA已成为眼下最受关注的深度学习加速芯片。而Intel收购FPGA厂商Altera、亚马逊、腾讯、阿里等先后推出FPGA公有云,更使得“FPGA+深度学习”应
STM32快速开发笔记——循环冗余校验之CRC

STM32快速开发笔记——循环冗余校验之CRC

2017-07-02 21:00:00
以前,嵌入式MCU功能简单、种类较少,软件开发起来相对容易,而今天,MCU功能强大、种类繁多,软件中实现的功能也要比以前更多更复杂。该系列课程,针对基于ARM的STM32 MCU,将利用STM32cu
深度学习基本单元(2D卷积模块)的FPGA实现

深度学习基本单元(2D卷积模块)的FPGA实现

2017-06-24 20:00:00
鉴于在深度学习加速方面的独特优势,FPGA已成为眼下最受关注的深度学习加速芯片。而Intel收购FPGA厂商Altera、亚马逊、腾讯、阿里等先后推出FPGA公有云,更使得“FPGA+深度学习”应