算力大爆炸时代,加速云的FPGA有啥妙招在手?

2018-05-04 15:41:54 来源:EEFOCUS
标签:

AlphaGo在围棋上对人类的“肆虐”让人工智能火了,这个1956年就诞生的词汇为什么在近两年再次被推到了风口浪尖之上?这背后离不开三大要素:算法、数据、算力。而算力是附着于芯片之上,没有芯片,人工智能就是一纸空谈。

 

那么问题来了,怎样的芯片才是人工智能的最佳助推器?

 

众所周知,GPU 最早是为生成基于多边形网络的计算机图形而设计的。在最近几年,由于计算机游戏和图形引擎领域的需求和复杂度需要,GPU积累了强大的处理性能。英伟达是 GPU领域的领军者,能生产有数千个内核的处理器,这些内核的设计工作效率可以达到 100%。实际上这些处理器也非常适用于运行神经网络和矩阵乘法方面的计算。

 

那素有“芯片皇冠上的明珠”之称的FPGA又处于什么地位呢?

 

加速云创始人兼CEO邬刚,拥有15年以上FPGA领域经验,在接受与非网记者采访时也只能表示:“在深度学习领域,FPGA并不是全部能够搞定。”但是FPGA也拥有让这个领域无法拒绝的理由。

 

加速云创始人兼CEO 邬刚

 

“对低延时要求很高的场景,只能选择FPGA;在做LSTM方面,GPU很烂,FPGA很强;虽说FPGA不能做训练,但所有ASIC的前提都是FPGA的战场,因为它是可配置的处理器。与专用神经网络处理器相比,FPGA的优势就是开发周期短。”为FPGA站台的这份自信,不仅得益于技术本身,还有加速云存在的意义让邬刚感怀良多。

 

在2018年4月27日,加速云推出了四大产品:两个系列硬件加速产品(SC-OPS, SC-VPX)、两个IP库 (FDNN, FBLAS)、三大解决方案(深度学习解决方案、高性能计算及数字信号处理解决方案、边缘计算解决方案)。

 

 

工控是一个绝佳选择

2014年10月英特尔在IDF大会上宣布X86+FPGA处理器,本就有用FPGA来做异构计算的邬刚开始“心动”了。这个时代对高效计算系统的贪婪,让异构计算被推到了时代的前沿。而加速云选择了工控领域来展现X86+FPGA的实力,为什么做出这个选择呢?

 

邬刚表示:“一方面传统工控机就是PC,采用的是比笔记本低两代的芯片,无法满足日益复杂的控制算法。其次,工控领域是一个强实时的领域,而FPGA具有纳秒级的反应。并且,随着工业领域传感器不断增多,人工智能概念的不断渗透,传统PC是扛不住的。”

 

据资料显示,加速云的基于FPGA的智能工控加速方案采用Intel Arria GX660器件,单颗芯片集成1.5TFLOPS单精度浮点处理能力,提供PCLe3.0高速接口与X86系统互联,支持40Gbps的传输带宽,根据客户需求定制PCIE3.0/USB3.0/SATA3.0/HDMI/DVI/MIPI/CSI多种高速IO接口,也支持CAN/UART/SPI/TTL等低速扩展接口。支持高性能计算FBLAS库和深度学习FDNN库,支持OPenCL开发支持包。

 

在谈及FPGA的短板,邬刚毫不避讳的谈到FPGA的生态与GPU比,可以用烂来形容。GPU的生态靠英伟达常年积累而成,而现在的FPGA生态只处于GPU做库达的阶段。邬刚表示:“虽然FPGA的设计思想不一样,但还是希望干出一个类似CUDN库的东西。未来FPGA也越来越不像FPGA,我们也在发展上层语言,来弥补生态,这需要时间,这也是我们这种公司存在的理由。”

 

参会嘉宾参观展台

 

与非网报道内容,未经许可,不得转载!

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
张亚
张亚

与非网编辑,网名亚亚君,光电与半导体材料专业出身,喜欢音乐和看书。只愿与你相识在文字中。

继续阅读
RISC-V的开源架构能给智能芯片带来什么机遇?
RISC-V的开源架构能给智能芯片带来什么机遇?

最近人工智能芯片很火,华为发布了两款AI芯片—升腾910和310,阿里成立的芯片公司“平头哥”,首款AI芯片最快明年下半年面世,人工智能依然是风口。

人工智能将由什么来引领,听听英伟达中国区CTO赵立威的说法
人工智能将由什么来引领,听听英伟达中国区CTO赵立威的说法

提到英伟达,大多数人会以为,它是一家卖显卡的硬件公司,是“游戏芯片供应商”、“全球最大的图片芯片制造商”。现在英伟达是一家AI公司,深度学习正在创造收入增长,据官方发布的数据,截至2018年7月29日,英伟达第二季收入达到31.2亿美元,较去年同期增长40%。公司在AI、游戏、专业视觉和自动驾驶平台均取得增长。

从FPGA到ACAP,“万能芯片” 的华丽转身
从FPGA到ACAP,“万能芯片” 的华丽转身

FPGA被誉为“万能芯片”,能量就只有这么一点?当然不是的,目前FPGA在数据中心领域已经得到认可,加速卡解决方案成为数据中心的首选。而人工智能通过深度学习算法在认知智能和推理智能上遇到难题,擅长推理的FPGA被寄予厚望。

GPU如何训练大批量模型?方法在这里

深度学习模型和数据集的规模增长速度已经让 GPU 算力也开始捉襟见肘,如果你的 GPU 连一个样本都容不下,你要如何训练大批量模型?通过本文介绍的方法,我们可以在训练批量甚至单个训练样本大于 GPU 内存时,在单个或多个 GPU 服务器上训练模型。

AI芯片厂商“华山论剑”,格局未定,混战开始
AI芯片厂商“华山论剑”,格局未定,混战开始

如果把AI的算法作为当年Windows的标准看,GPU可以简单比作当年英特尔的中央处理器,但现在还没有一个单独的公司在AI领域获得了当年像英特尔这样的地位,AI的混战只是刚刚开始。

更多资讯
《深度强化学习》手稿开放

一年前,机器之心发布了加拿大阿尔伯塔大学计算机系博士 Yuxi Li 的深度强化学习综述论文,该论文概述了在深度强化学习(Deep Reinforcement Learning)方面喜人的进展。而这本刚上线的《深度强化学习》手稿对前面的版本《深度强化学习综述》做了大规模的改进;从一年多前的 70 页扩充到现在的 150 页。

GICv3架构中,对中断的分组解析

GICv3架构中,对中断进行了分组。分成了以下三个组

想要学好大数据需掌握这十二大技术

大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所无法完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的IT技术。

基于SRAM工艺FPGA的保密性问题

在现代电子系统设计中,由于可编程逻辑器件的卓越性能、灵活方便的可升级特性,而得到了广泛的应用。

如果使用FPGA配合DSP来提升安全能力?

对于基于数字信号处理器(DSP)的设计,如果DSP没有足够的安全能力,便特别容易受到入侵。在许多应用中,如果使用FPGA以作配合来卸载DSP的部分工作,便可以轻易实施先进的安全功能。

Moore8直播课堂