算力大爆炸时代,加速云的FPGA有啥妙招在手?

2018-05-04 15:41:54 来源:EEFOCUS
标签:

AlphaGo在围棋上对人类的“肆虐”让人工智能火了,这个1956年就诞生的词汇为什么在近两年再次被推到了风口浪尖之上?这背后离不开三大要素:算法、数据、算力。而算力是附着于芯片之上,没有芯片,人工智能就是一纸空谈。

 

那么问题来了,怎样的芯片才是人工智能的最佳助推器?

 

众所周知,GPU 最早是为生成基于多边形网络的计算机图形而设计的。在最近几年,由于计算机游戏和图形引擎领域的需求和复杂度需要,GPU积累了强大的处理性能。英伟达是 GPU领域的领军者,能生产有数千个内核的处理器,这些内核的设计工作效率可以达到 100%。实际上这些处理器也非常适用于运行神经网络和矩阵乘法方面的计算。

 

那素有“芯片皇冠上的明珠”之称的FPGA又处于什么地位呢?

 

加速云创始人兼CEO邬刚,拥有15年以上FPGA领域经验,在接受与非网记者采访时也只能表示:“在深度学习领域,FPGA并不是全部能够搞定。”但是FPGA也拥有让这个领域无法拒绝的理由。

 

加速云创始人兼CEO 邬刚

 

“对低延时要求很高的场景,只能选择FPGA;在做LSTM方面,GPU很烂,FPGA很强;虽说FPGA不能做训练,但所有ASIC的前提都是FPGA的战场,因为它是可配置的处理器。与专用神经网络处理器相比,FPGA的优势就是开发周期短。”为FPGA站台的这份自信,不仅得益于技术本身,还有加速云存在的意义让邬刚感怀良多。

 

在2018年4月27日,加速云推出了四大产品:两个系列硬件加速产品(SC-OPS, SC-VPX)、两个IP库 (FDNN, FBLAS)、三大解决方案(深度学习解决方案、高性能计算及数字信号处理解决方案、边缘计算解决方案)。

 

 

工控是一个绝佳选择

2014年10月英特尔在IDF大会上宣布X86+FPGA处理器,本就有用FPGA来做异构计算的邬刚开始“心动”了。这个时代对高效计算系统的贪婪,让异构计算被推到了时代的前沿。而加速云选择了工控领域来展现X86+FPGA的实力,为什么做出这个选择呢?

 

邬刚表示:“一方面传统工控机就是PC,采用的是比笔记本低两代的芯片,无法满足日益复杂的控制算法。其次,工控领域是一个强实时的领域,而FPGA具有纳秒级的反应。并且,随着工业领域传感器不断增多,人工智能概念的不断渗透,传统PC是扛不住的。”

 

据资料显示,加速云的基于FPGA的智能工控加速方案采用Intel Arria GX660器件,单颗芯片集成1.5TFLOPS单精度浮点处理能力,提供PCLe3.0高速接口与X86系统互联,支持40Gbps的传输带宽,根据客户需求定制PCIE3.0/USB3.0/SATA3.0/HDMI/DVI/MIPI/CSI多种高速IO接口,也支持CAN/UART/SPI/TTL等低速扩展接口。支持高性能计算FBLAS库和深度学习FDNN库,支持OPenCL开发支持包。

 

在谈及FPGA的短板,邬刚毫不避讳的谈到FPGA的生态与GPU比,可以用烂来形容。GPU的生态靠英伟达常年积累而成,而现在的FPGA生态只处于GPU做库达的阶段。邬刚表示:“虽然FPGA的设计思想不一样,但还是希望干出一个类似CUDN库的东西。未来FPGA也越来越不像FPGA,我们也在发展上层语言,来弥补生态,这需要时间,这也是我们这种公司存在的理由。”

 

参会嘉宾参观展台

 

与非网报道内容,未经许可,不得转载!

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
张亚
张亚

与非网编辑,网名亚亚君,光电与半导体材料专业出身,喜欢音乐和看书。只愿与你相识在文字中。

继续阅读
你对ARM了解多少?

全世界100多家公司购买了ARM授权,包括三星,Freescale、NXP Semiconductors、STMicroelectronics、Texas Instruments ,Toshiba,Analog Device,atmel,microsemi...具体参看ARM官网

比特币熊市来临,是否领头羊更易存活?
比特币熊市来临,是否领头羊更易存活?

继续迭代技术、勤练内功,战场向海外转移,等待市场回暖,应该是比特大陆可以预计的战略。

选择合适的“连接器”其实非常伤脑!
选择合适的“连接器”其实非常伤脑!

如果你工作的地方只有一个饭馆,吃饭是件很自然的事情,去吃就好了。当你的周围有几十家饭馆的时候,你每天最困扰的就变成了“我今天要吃什么呢?”

AI 芯片对比传统芯片,有哪些区别?
AI 芯片对比传统芯片,有哪些区别?

传统的CPU、GPU都可以拿来执行AI算法,但是速度慢,性能低,无法实际商用。

一文看懂清华AI芯片报告,让你对AI一目了然

2010 年以来, 由于大数据产业的发展, 数据量呈现爆炸性增长态势,而传统的计算架构又无法支撑深度学习的大规模并行计算需求, 于是研究界对 AI 芯片进行了新一轮的技术研发与应用研究。 AI 芯片是人工智能时代的技术核心之一,决定了平台的基础架构和发展生态。

更多资讯
简单几步让你看懂单片机时序图

操作时序永远是使用任何一片IC芯片的最主要的内容,看懂时序图,再操控这个芯片就非常容易了。而提取芯片器件手册上有用的信息是使用芯片的最基本步骤。

如何实现SoC全生命周期的监测?

SoC的设计越来越复杂,上市时间、软硬件集成、系统级验证、系统性能、异构、网络安全/功能安全等都是设计人员需要考虑的因素。流片前,设计师能通过仿真软件进行验证,但是流片过程中很多意想不到的结果,需要在流片后仍能被准确的检测出来。

如何将单片机的波特率作为形参的函数

不管是什么单片机,在使用串口通信的时候,有一个非常重要的参数:波特率。什么是波特率:波特率就是每秒传送的字节数。双方在传输数据的过程中,波特率一致,这是通讯成功的基本保障。

代码分享教你如何使用msp430单片机延时函数

今天看示例程序中出现了__delay_cycles()这个函数,在查找msp430x54x.h这个头文件的时候,发现这个头文件中没有该函数的声明,原来这个函数已经在IAR这个编译器中集成,这里总结一下__delay_cycles();这个函数的具体用法

如何控制51单片机液晶实现计时器的功能?

要想实现人机交互,显示装置是不可缺少的。前面讲到了如何利用单片机控制数码管的显示,这篇文章主要关于如何控制液晶显示,并在此基础上加上定时器的功能,把原来已用数码管显示的定时器搬到液晶屏上来。