CPU并非万能,深度学习为啥更看好GPU、FPGA发挥?

2017-02-17 10:26:36 来源:动点科技
分享到:
标签:

 

深度学习全称深度神经网络,本质上是多层次的人工神经网络算法,即模仿人脑的神经网络,从最基本的单元上模拟了人类大脑的运行机制。近年来,其所取得的前所未有的突破掀起了人工智能新一轮的发展热潮。


最早的神经网络的思想起源于 1943 年的 MCP 人工神经元模型,当时是希望能够用计算机来模拟人的神经元反应的过程,但直到最近,它才真正让人工智能火起来。主要原因在于:算法的突破、数据量的激增和计算机能力/成本的下降。其中计算能力的提升的作为人工智能实现的物理基础,对人工智能发展的意义不言而喻。


本文我们就来分析目前主流的深度学习芯片的优缺点。


CPU 不适合深度学习

深度学习与传统计算模式最大的区别就是不需要编程,它是从输入的大量数据中自发地总结出规律,而传统计算模式更多都需要人为提取所需解决问题的特征或者总结规律来进行编程。也正因为如此,深度学习对计算能力要求非常高,以至于有人将深度学习称之为“暴力计算”。


因此,传统的 CPU 并不适用于深度学习。


从内部结构上来看,CPU 中 70%晶体管都是用来构建 Cache(高速缓冲存储器)和一部分控制单元,负责逻辑运算的部分(ALU 模块)并不多。控制单元等模块的存在都是为了保证指令能够一条接一条的有序执行。


这种通用性结构对于传统的编程计算模式非常适合,但对于并不需要太多的程序指令,却需要海量数据运算的深度学习的计算需求,这种结构就显得有心无力了。


GPU 深度学习主流芯片

与 CPU 少量的逻辑运算单元相比,GPU 整个就是一个庞大的计算矩阵,GPU 具有数以千计的计算核心、可实现 10-100 倍应用吞吐量,而且它还支持对深度学习至关重要的并行计算能力,可以比传统处理器更加快速,大大加快了训练过程。GPU 是目前最普遍采用的深度学习运算单元之一。


目前,谷歌、Facebook、微软、Twitter 和百度等互联网巨头,都在使用 GPU 作为其深度学习载体,让服务器学习海量的照片、视频、声音文档,以及社交媒体上的信息,来改善搜索和自动化照片标记等各种各样的软件功能。而某些汽车制造商也在利用这项技术开发无人驾驶汽车。
不过,由于 GPU 的设计初衷是为了应对图像处理中需要大规模并行计算。因此,根据乐晴智库介绍,其在应用于深度学习算法时有数个方面的局限性:


第一, 应用过程中无法充分发挥并行计算优势。深度学习包含训练和应用两个计算环节,GPU 在深度学习算法训练上非常高效,但在应用时一次性只能对于一张输入图像进行处理, 并行度的优势不能完全发挥。


第二, 硬件结构固定不具备可编程性。深度学习算法还未完全稳定,若深度学习算法发生大的变化,GPU 无法灵活的配置硬件结构。


另外,在能耗上面,虽然 GPU 要好于 CPU,但其能耗仍旧很大。

STM32 USB应用基本协议介绍
e络盟限时特惠,新客户首单85折优惠,再享免运费
意法半导体STM32 USB资源一览
ST MCU Finder电脑版选型工具下载
 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
与非网小编
与非网小编

电子行业垂直媒体--与非网小编一枚,愿从海量行业资讯中淘得几粒金沙,与你分享!

继续阅读
配备NVIDIA DRIVE PX2,工研院欲在自动驾驶上做啥文章?

工研院在2016年9月与NVIDIA签署合作备忘录,近期已在自动驾驶的深度学习上,有了初步成果。

芯思想︱俄罗斯芯图谋,重现CPU辉煌:战斗民族的微电子发展史
芯思想︱俄罗斯芯图谋,重现CPU辉煌:战斗民族的微电子发展史

2016年8月,俄罗斯总理梅德韦杰夫对俄罗斯当前微电子产业的领先公司JSC Angstrem进行调研,Angstrem目前已经拥有了90纳米的技术和生产,未来俄罗斯的任务是要向新的微电子技术迈进,生产28或是14-16纳米的微电子产品。

英伟达又发声:AI主芯片这场混战,GPU有多少胜算?

GPU模型推论效能不断提升,各种边缘运算装置上所内建的人工智能(AI)能力也变得更加强大。 NVIDIA旗下软件目前已可协助客户做8位与16位的神经网络运算优化,不仅让GPU模型的推论(Inference)更形完善,同时对硬件资源的需求也明显降低,只需要一小块电路板就能支持AI算法。

芯片厂商逢甘霖,苹果新iPhone单季芯片需求量创新高

尽管业界先前传出苹果(Apple)2017年新款iPhone新增功能的芯片量产良率不如预期,可能延后上市日期,然近期国际芯片大厂透露苹果下单进度正常,第2季开始着手备货芯片,初期每月虽仅有几百万颗量能,但预期第2季底、第3季初下游代工厂备货量能将快速增至每月逾千万颗芯片规模。

谷歌的TPU芯片效能到底能不能超越CPU与GPU,我们看图说话
谷歌的TPU芯片效能到底能不能超越CPU与GPU,我们看图说话

Google在一项机器学习测试报告中指出,其TPU的效能较英特尔的Haswell CPU与Nvidia K80 GPU更高至少15倍,每瓦执行的兆次运算也提高了30倍以上…

更多资讯
二维材料造出的微处理器有啥优势?据说是革命性的
二维材料造出的微处理器有啥优势?据说是革命性的

研究人员用类似于石墨烯的二维材料制造出微处理器,有些人认为,这种神奇的弹性导电材料可能会给电池、传感器、芯片设计带来革命性的变化。

芯片世界观 | 英特尔Optane SSD DC P4800X评测,一张表看出猫腻

英特尔Optane SSD DC P4800X是NVMe标准的PCIe SSD,3D XPoint内存取代NAND闪存可提供优于其他NVMe SSD的吞吐量与更低访问延迟。

芯片世界观︱潘多拉魔盒已打开,高通的大麻烦还在后面?
芯片世界观︱潘多拉魔盒已打开,高通的大麻烦还在后面?

高通的潘多拉魔盒已打开。高通和苹果、黑莓之间的官司还在可控范围之内,但是,它可能会带来一些辐射性的影响。如果高通在美国公平交易委员会(FTC)发起的诉讼中落败,后果将一发不可收拾,因为这可能会迫使高通转变其固有的业务模式。这意味着它的授权和许可营收将大受影响,在这种局面下收购恩智浦可能不是个好主意。

华为P10闪存门有苦衷?国产存储成阵痛
华为P10闪存门有苦衷?国产存储成阵痛

这两日在科技圈热议的除了“小米6”的发布以外,另一个应该就是华为的P10的“闪存门”了

Vishay推出2颗适用于便携式电子产品中DC/DC转换的超薄功率电感器---IFL和IFLS系列
Vishay推出2颗适用于便携式电子产品中DC/DC转换的超薄功率电感器---IFL和IFLS系列

2017 年 4 月21 日 — 日前,Vishay Intertechnology, Inc.(NYSE 股市代号:VSH)宣布,推出2颗适用于便携式电子产品中DC/DC转换的新系列超薄功率电感器---IFL和IFLS系列。

微话题

你与哪款手机更投缘

手机缘分测试……
Moore8直播课堂
2017年STM32中国峰会在线直播

2017年STM32中国峰会在线直播

2017-04-25 09:30:00
2016年在深圳举行的首届STM32中国峰会取得了巨大的成功, 并极大的加强了STM32品牌在中国的影响力,巩固了意法半导体在全球半导体技术市场的领先地位,同时还得到嵌入式应用生态系统合作伙伴的大
EMC专家武晔卿系列5—EMC器件的选型(结构布局与材料篇)

EMC专家武晔卿系列5—EMC器件的选型(结构布局与材料篇)

2017-04-25 20:00:00
一个好的电子产品,除了产品自身的功能以外,电磁兼容设计的技术水平,对产品的质量和技术性能指标起到非常关键的作用。很多人从事电子线路设计的时候,都是从认识电子元器件开始,但对电磁兼容设计却无从下手。
如何应对射频嵌入式系统多域测试的挑战?

如何应对射频嵌入式系统多域测试的挑战?

2017-04-27 10:00:00
从物联网、智能终端到工业4.0,射频嵌入式系统正快速扩展到各个应用领域。但由于新技术的引入,传统测试测量仪器难以发现并定位干扰源。1,如何准确进行传感器小信号测试?2,怎样把控示波器触发灵敏度对测
智能车老司机chiusir解读电磁导航原理与k66核心算法

智能车老司机chiusir解读电磁导航原理与k66核心算法

2017-04-16 20:00:00
提及智能车竞赛,所有电子相关专业的大学生或多或少都参加此类比赛,也承载了数万学子青春奋斗的美好,无数次通宵达旦只为在赛场上那千分之一秒的激情。但对于很多初入比赛的鲜肉来说,无尽的资料手册、新的赛制
EMC专家武晔卿系列6-EMC与安规设计、热设计、可靠性、工艺的技术冲突

EMC专家武晔卿系列6-EMC与安规设计、热设计、可靠性、工艺的技术冲突

2017-05-02 20:00:00
一个好的电子产品,除了产品自身的功能以外,电磁兼容设计的技术水平,对产品的质量和技术性能指标起到非常关键的作用。很多人从事电子线路设计的时候,都是从认识电子元器件开始,但对电磁兼容设计却无从下手。