一家成立7年的AI公司,要靠DPU干翻GPU?

2017-09-13 13:51:00 来源:DIGITIMES
分享到:
标签:
AI   DPU   GPU

 

成立7年的AI新创公司Wave Computing日前在Hot Chips大会上介绍了该公司研发的多核架构资料流处理器(Dataflow Processing Unit;DPU),号称在神经网路训练速度方面可达GPU加速器的1,000倍,该公司技术长Chris Nicol更认为资料流架构是训练高效能网路最有效的方式。
 
根据The Next Platform报导,Nicol在应用多核策略解决问题方面拥有丰富的经验,不仅曾协助澳洲最大的资讯及通讯科技研究机构NICTA,也成立了贝尔实验室共同研发最早的多处理器系统单晶片。 Nicol认为未来大规模的训练迟早会移出资料中心改在边缘执行,彰显DPU元件的潜在价值。
 
Wave Computing发表的DPU晶片具有16,000个处理元件、8,000个以上的运算单元以及独特的自定时机制,使用粗粒可重组式架构(coarse grained reconfigurable architecture),运行频率为6.7GHz,在没有资料通过时,DPU会进入休眠状态。 DPU可以看作是FPGA与多核处理器的混合体,能处理数千个元件的静态资料流图排程。
 
Nicol表示,目前异质运算的定义有个问题,也就是主控都在CPU上执行,加速器必须等待CPU下达指令,而Wave Computing希望彻底改变这样的架构。 Nicol指出,新的加速器架构(尤其是GPU)在载入核心(kernel)以及使用微控制器在执行期移出与移入程式时都会产生延迟问题,而一个去除CPU的架构可以在卸载模式中得到更多性能效益。
 
Nicole指出,深度学习实际就是在深度学习软体上编程的资料流图,在类似Wave这种可以在执行期组成资料流图的处理器上运行,而这样的工作流程产生了用来训练网路的资料流图。举例来说,系统会在执行期从TensorFlow取得资料流图,然后直接将它转换成不需要CPU就可执行的资料流图,然后再映成到Wave的资料流晶片上。
 
Nicol表示,这是一个粗粒可重构阵列,有点类似空间运算(spatial computing),当程式编译为多处理器核心时,仍然需要将该程式分区,这也是多核晶片的问题所在,而开放式运算语言(OpenCL)并无法提供解决之道。 Wave有自己的空间编译器可以排程、规定路线、将软体映成在其紧密耦合的互连处理器架构上,这样会比使用暂存器速度更快。
 
尽管这些新架构非常令人注目,但GPU的软体生态系统在机器学习工作负载已十分健全,超大规模资料中心是否愿意容忍风险,导入一个完全不同的训练模式,还是由他们自己决定。

 

更多最新行业资讯,欢迎点击与非网《今日大事要闻》

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
一文读懂麒麟970,华为今年最强大的芯

继今年IFA展上,华为消费者业务CEO余承东发布华为首个人工智能芯片——麒麟970后,今天华为在北京举办了以“智汇”为主题的2017麒麟芯片媒体沟通会,麒麟970首次亮相中国。华为Fellow艾伟向业界和中国消费者展现了麒麟970在移动宽带联接、人工智能移动计算方面的创新,以及麒麟970如何利用端侧人工智能延伸用户的视力和听力。

华为麒麟 970国内亮相,降功耗是重点
华为麒麟 970国内亮相,降功耗是重点

9 月 25 日上午,华为在北京召开了麒麟 970 的媒体沟通会,这也是麒麟 970 在国内的首次亮相。和本月初在德国 IFA 电子展的首秀相比,在这一次的国内沟通会上,华为公布了麒麟 970 更多的技术细节和具体应用。

麒麟970处理器图文评测,有哪些新功能?
麒麟970处理器图文评测,有哪些新功能?

在德国IFA 2017大会上赢得全世界瞩目后,华为麒麟970今天第一次在国内亮相,华为打造的首个人工智能移动计算平台越来越近了。

麒麟970的AI功能厉害吗?华为Mate 10告诉你
麒麟970的AI功能厉害吗?华为Mate 10告诉你

AI(人工智能)是华为麒麟970今年最大的亮点和创新之一,为此,华为芯片级地集成了NPU(神经处理单元),同时打造了一套HiAI移动计算架构。

加班10天给10万, 怎么拿到年薪百万?
加班10天给10万, 怎么拿到年薪百万?

近日,爱尔兰瑞安航空向飞行员致信,称如果机长1年内统一加班10天的话,可一次性获得1.2万欧元的奖金,相当于人民币9.4万元左右。

更多资讯
专注嵌入式计算机模块,康佳特解读如何做到“专而强”
专注嵌入式计算机模块,康佳特解读如何做到“专而强”

欧洲不乏“精而美”的企业,德国中小企业表现尤为突出。研究表明,德国大多数企业秉持相同的模式,即并非全力占据整个产业链,而是专注于某一特定的 “缝隙市场”,集中全力研究生产某一专业产品,通过扩展到全世界的销售网络形成这个细分市场的小巨头,做到“专而强”。

抢苹果A11芯片的人工智能风头,英特尔Myriad X VPU哪来的实力?

苹果A11 Bionic SoC有着非常杰出的benchmark分数,然而我认为英特尔的Myriad X VPU未来更具潜力。英特尔子公司Movidus最初设计了第一个Myriad VPU,作为智能手机和其他移动设备的协处理器。Myriad X现在变成了一款独立处理器,而且具有专用的神经计算引擎。

谷歌收购HTC,其实是“抄袭”苹果?

9月26日报道,上周,谷歌宣布收购HTC部分智能手机业务。此举不但重塑了搜索巨人的硬件野心,也代表了科技界大震荡的新趋势,一场争夺用户的大戏正在上演。

奥巴马1年赚4亿,这个事件在他的回忆录要写一笔
奥巴马1年赚4亿,这个事件在他的回忆录要写一笔

据外媒报道,奥巴马一卸任就和妻子米歇尔,签订了一份超过6000万美元(约合人民币4亿元)预付款的天价图书出版合同,创造了美国总统回忆录的最高竞价记录!这样的“天价”著书可以说让奥巴马这位美国历史上第一位黑人总统卸任后也衣食无忧。

芯片制造上重心转移,技术嫁接到汽车芯片
芯片制造上重心转移,技术嫁接到汽车芯片

随着汽车能做的事情越来越多,需要更先进的处理器来驱动汽车,加强汽车控制,并提供娱乐。市场研究机构IDC估计,到2021年,半导体供应商将从汽车市场获得50.1亿美元的收入,比2016年增长52%。

微话题

年初定的哪些“小目标”没有阵亡?

2017年能耗过半,年初定的哪些“小目标”没有阵亡? ……