一家成立7年的AI公司,要靠DPU干翻GPU?

2017-09-13 13:51:00 来源:DIGITIMES
分享到:
标签:
AI   DPU   GPU

 

成立7年的AI新创公司Wave Computing日前在Hot Chips大会上介绍了该公司研发的多核架构资料流处理器(Dataflow Processing Unit;DPU),号称在神经网路训练速度方面可达GPU加速器的1,000倍,该公司技术长Chris Nicol更认为资料流架构是训练高效能网路最有效的方式。
 
根据The Next Platform报导,Nicol在应用多核策略解决问题方面拥有丰富的经验,不仅曾协助澳洲最大的资讯及通讯科技研究机构NICTA,也成立了贝尔实验室共同研发最早的多处理器系统单晶片。 Nicol认为未来大规模的训练迟早会移出资料中心改在边缘执行,彰显DPU元件的潜在价值。
 
Wave Computing发表的DPU晶片具有16,000个处理元件、8,000个以上的运算单元以及独特的自定时机制,使用粗粒可重组式架构(coarse grained reconfigurable architecture),运行频率为6.7GHz,在没有资料通过时,DPU会进入休眠状态。 DPU可以看作是FPGA与多核处理器的混合体,能处理数千个元件的静态资料流图排程。
 
Nicol表示,目前异质运算的定义有个问题,也就是主控都在CPU上执行,加速器必须等待CPU下达指令,而Wave Computing希望彻底改变这样的架构。 Nicol指出,新的加速器架构(尤其是GPU)在载入核心(kernel)以及使用微控制器在执行期移出与移入程式时都会产生延迟问题,而一个去除CPU的架构可以在卸载模式中得到更多性能效益。
 
Nicole指出,深度学习实际就是在深度学习软体上编程的资料流图,在类似Wave这种可以在执行期组成资料流图的处理器上运行,而这样的工作流程产生了用来训练网路的资料流图。举例来说,系统会在执行期从TensorFlow取得资料流图,然后直接将它转换成不需要CPU就可执行的资料流图,然后再映成到Wave的资料流晶片上。
 
Nicol表示,这是一个粗粒可重构阵列,有点类似空间运算(spatial computing),当程式编译为多处理器核心时,仍然需要将该程式分区,这也是多核晶片的问题所在,而开放式运算语言(OpenCL)并无法提供解决之道。 Wave有自己的空间编译器可以排程、规定路线、将软体映成在其紧密耦合的互连处理器架构上,这样会比使用暂存器速度更快。
 
尽管这些新架构非常令人注目,但GPU的软体生态系统在机器学习工作负载已十分健全,超大规模资料中心是否愿意容忍风险,导入一个完全不同的训练模式,还是由他们自己决定。

 

更多最新行业资讯,欢迎点击与非网《今日大事要闻》

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
人工智能“高速”通车,各地方政府抓紧上路

刚过去的一周,科技部召开新一代人工智能发展规划暨重大科技项目启动会,发布了四大国家级人工智能创新平台;上海发布了人工智能(AI)产业政策,布局产业规模过千亿;11月18日,武汉东湖高新区发布AI产业政策,布局百亿产业。

应届生年薪50万还没招不到人?AI行业到底有多火?

当很多大学毕业生还在为10万元年薪欢呼时,炙手可热的AI专业应届生年薪已高达30万~50万元,干个三五年后很有可能涨至80万元。不过,这个价位主要针对的是研究生学历人才。

在打击贩毒这件事上,AI扮演怎样的角色?
在打击贩毒这件事上,AI扮演怎样的角色?

身处21世纪,令我们忧心忡忡的是,如今毒品这个恶症非但没有逐渐康复的迹象,反而愈演愈烈变本加厉——暗网带来的新销售网络、新型毒品的隐性危害、难以察觉的实验室毒品,都拷问着全世界对毒品犯罪的固有防线。

从学术到应用,一起看看AI落地的四元分析

我之前在学术界,现在在工业界。现在不少学界的科学家都到公司里面做研发,通常遇到的一个问题是:在工业界从事研发和以前在学界究竟有哪些不同?很多关心研发的人会有这样的疑问。

应届生年薪就高达50万,AI人才到底有多抢手?
应届生年薪就高达50万,AI人才到底有多抢手?

刚刚过去的周末,人工智能连放大招——来自波士顿动力(Boston Dynamics)的机器人“阿特拉斯”展现了完美的后空翻动作;腾讯推出的新闻写作机器人Dreamwriter用0.5秒便写出千字文,一口气写了14篇稿,还可自动配图和剪辑视频。

更多资讯
英特尔管理引擎存安全漏洞,官方表示最坏情况可能发生

据国外媒体报道,多年来安全研究人员一直警告英特尔管理引擎(ME)的远程管理功能存在安全漏洞。虽然管理引擎为IT经理提供了许多有用的功能,但需要深入进行系统访问,这为攻击者提供了一个诱人的目标。让管理引擎发挥作用可能会导致黑客完全控制目标计算机。

苹果推送iOS 11.1.2,iPhone X最受益
苹果推送iOS 11.1.2,iPhone X最受益

跟往常一样,在iPhone6s收到苹果公司推送的iOS11.1.2版本系统后,于第一时间进行了升级。

三星恐怖的研发投资只为压制“中国芯”?
三星恐怖的研发投资只为压制“中国芯”?

今年的内存疯长,相信给大家留下了深刻的印象,在电子市场越来越便宜的大环境下,内存一年涨了三倍这样那完全就是一个奇迹。其中三星在内存、闪存市场都占有最大份额,是这次涨价中最大的赢家。据韩媒报道,三星对芯片业务上的投资规模夸张到已经高于英特尔、台积电的投资总和,达到了260亿美元。

英特尔转型AI,能抵制 英伟达的进攻吗?
英特尔转型AI,能抵制 英伟达的进攻吗?

看到英伟达的成功,说英特尔不羡慕那是假的,于是,转型IOT和人工智能,收购Altera、Movidious和Mobileye,英特尔帝国也开始了,那么,未来,它能否抵挡英伟达的进攻吗?

荣耀V10下周二发布,胡歌代言最便宜的麒麟970手机
荣耀V10下周二发布,胡歌代言最便宜的麒麟970手机

下周二,华为旗下互联网手机品牌荣耀,要发布年度新旗舰,不出意外,应该就是我们期待已久的荣耀V10,据此前传言,新机并不比华为Mate 10差,售价的话 ,不会超过三千元。

微话题

工作 or 考研?

又到一年招聘季,考研or工作让你实现了怎样的逆袭?……
Moore8直播课堂