CPU性能提升乏力影响行业发展,未来怎么办

2018-12-01 07:54:47 来源:EEFOCUS
标签:

 

虽然CPU仍然在不断发展,但是它的性能已经不再仅仅受限于单个处理器类型或制造工艺上了。

 

和过去相比,CPU性能提升的步伐明显放缓了,接下来怎么办,成为横亘在整个行业面前的大问题。

 

自2010年开始,单个CPU内核的处理能力就逐渐停止了增长的脚步,发热和噪声等和功耗相关的问题迫使处理器公司另辟蹊径,不再汲汲于推高时钟频率,转而在CPU中集成更多内核。多核设计的引入,下一代制造工艺对功耗和性能的改进,推动着处理器性能继续跟随着工艺升级的步伐大幅提升。但是现在,制造工艺升级对性能的提升幅度也大不如前,再加上许多公司已经完全停止了在更先进工艺节点上的努力,CPU性能的提升再次遇到了瓶颈。

 

CPU性能提升乏力的严峻现实影响到了多个行业的发展。软件开发人员已经习惯了并理所当然地预计计算和内存资源将会不断增长,但是现在,CPU性能提升的速度大不如前了。正是在摩尔定律的加持下,软件可编程能力和丰富的功能集合才得以出现并发挥重要作用,也给硬件工程师和软件工程师提供了一种缓冲。

 

“由于摩尔定律,计算能力的增长和加速在部分程度上应该归功于英特尔等公司不断前进到下一代工艺节点上,从而使得计算引擎本身的优化不再那么重要了,”Microchip旗下美高森美战略营销高级总监Nilam Ruparelia说。“再加上软件技术本身的进步,使得软件生产力提高的速度大大超过了摩尔定律。如果能够让编程变得轻松容易,就会有更多的人从事编程。通过软件完成各种事务的能力也已经大大增强。”

 

 

工艺的升级越来越难了。Flex Logix首席执行官Geoff Tate表示,“处理器已经不再是执行计算任务的唯一解决方案了。看看数据中心吧,之前,这里面唯一的处理器件只有x86,但是现在,各种配置的FPGA和GPU处理器的身影几乎无处不在。”

 

这种异构方案在人工智能/机器学习的设计中尤为普遍。“根据运算的性质,很有必要将矩阵运算或密集型的线性代数运算放到GPU上执行,”Arteris IP营销副总裁Kurt Shuler说。 “你可以设计自己专属的ASIC进一步优化计算性能,也可以把一些任务负荷分配到FPGA上。当然,你可能依然需要CPU来管理高级别的数据控制流。总之,处理器件的数量越来愈多,而且变得越来越复杂。如果你分析一下数据中心就会发现,它们变得越来越异构化了。”

 

之所以出现这种转变,是因为物理规律的限制。“我们在RISC和CISC架构上已经做到头了,”西门子旗下Mentor的Questa产品经理Gordon Allan警告说。“可编程性和传统逻辑都在演变。现在,各种定制逻辑器件实现通用功能,然后通过智能互联技术把所有这些功能融合在一起。而之前则是通过软件将一些微操作组合在一起形成算法。”

 

这当然不意味着CPU会消亡或者停止演进,只不过CPU架构师的工作变得更加困难了。“通用CPU架构和微架构依然会继续发展,而且足以高效地胜任大多数任务,并将设计、生态建设和复杂性维持在可持续的水平上。”Arm嵌入式和汽车业务线战略副总裁Tim Whitfield表示。

 

影响架构改变的最大障碍之一是可编程能力。“可编程能力的大小,甚至没有可编程能力也不会对整体效率带来多大影响,”Mentor的HLS平台项目主管Russell Klein说。 “传统的CPU、DSP、多核CPU和FPGA都是可编程的,但具有截然不同的效率和不同的编程难度。可编程能力在一定程度上降低了效率,但是影响效率的主要因素却在于并行计算能力。DSP具有执行特定任务的能力,其效率高过CPU。GPU也有一些特定于专业领域的计算单元,而且引入了并行计算。FPGA和ASIC的并行计算能力更为出色。”

 

硬件器件的异化比较容易,摆脱旧有的软件范式却非常艰难。“业界将应用程序进行更改,以适应更广泛的芯片类型。”Allan说。“这导致了新的软件生态系统和新API的出现,但是它们都只不过是在原有软件上构建了更多的层而已。这样做,都是为了试图让一个触及性能极限和低功耗极限的处理器继续工作而已。现在我们需要一些新的方法。”

 

“在这种情况下,人们应该把注意力从在软件开发上进行修补转移到新型硬件上,只有适当的硬件才能实现真正的节能。”Menta业务开发总经理兼副总裁Yoan Dupret说。“这将最终催生具有高度灵活性的异构芯片。Tsugio Makimoto博士之前就曾经预测过,今天我们正在进入“高度灵活的超级整合”时代。”

 

CPU的改进

对于那些认为CPU已经走入死胡同的说法,我想引用马克吐温先生的话回怼一下:“说我已经死了的报道太夸张了。”

 

CPU还有若干进一步改进的路径。其中之一就是针对特定功能添加定制指令,不过这也有一定的风险。“如果器件可编程,增加了指令就意味着增加了硬件的复杂性,”GreenWaves Technologies业务开发副总裁Martin Croome警告说。“新的指令单元里的每一个晶体管都有静态泄露,如果器件有低功耗指标,情况就糟糕了,新指令单元不仅增加成本,也提高了功耗。你必须小心,看看增加新指令是否利大于弊。”

 

在CPU的发展历史中,新的指令单元不断被增加进来。“随着制造工艺的发展,处理器设计人员可以使用的晶体管越来越多,于是他们增加了越来越多的功能,以加速运行在其上的单线程程序。”Mentor的Klein说道。“他们添加了各种指令单元,比如预测执行、分支预测、寄存器别名等等,但是,添加新指令单元的得失对比使得这条路子越走越窄了。”

 

在大多数情况下,能力整合可以带来一定的好处。“在处理器件的发展历史中,我们多次看到通用CPU集成各种加速器的情形。”Arm的Whitfield解释道,“通常,我们会对架构和微体系架构进行调整,将加速度集成到通用CPU中,这方面的例子包括浮点和加密加速器。”

 

还有一条路径:做减法。“我们认为RISC-V这种新的方案更好,它可以帮助我们在一定程度上克服摩尔定律的放缓,”美高森美的Ruparelia说。“一种全新的、优化的架构给我们提供了更多的方法,以克服摩尔定律放缓带来的挑战。如果硅片工艺的进化停止了,就像发条被拧到了最紧一样,你必须优化所有的层面-CPU、特定域的架构、工具链,甚至编译器也要针对特定应用进行优化。”

 

必须根据最终产品的目标设计合适的处理器。“通过比较不同处理器的能效,算法可以在消耗最少能量的情况下在相对简单的处理器上执行,”Klein补充说。“更大的处理器可以更快地完成工作,但是它们的能效低得多。此外,在几个小型处理器中并行运行某个算法,其能效比在一个大型处理器上运行这个算法高得多。随着更多简单内核的引入,电压和时钟频率可以进一步降低,从而进一步提高能效。”

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
与非网 小编
与非网 小编

电子行业垂直媒体--与非网小编一枚,愿从海量行业资讯中淘得几粒金沙,与你分享!

继续阅读
董明珠不去攻克压缩机为什么专门盯着芯片?
董明珠不去攻克压缩机为什么专门盯着芯片?

近日,格力电器(000651.SZ)公告称,公司拟花费30亿参与闻泰科技对安世集团的收购案。这是格力电器迄今为止最大一笔对外投资。收购消息因此也被外界广泛认为,格力电器打通了未来的芯片之路。

作为数据的重要入口,传感器出现故障怎么办
作为数据的重要入口,传感器出现故障怎么办

为什么需要净化传感器数据,它为何对系统设计的各个层面都有广泛影响。

S3C2440 cpu的初始化问题研究

设置处理器的模式为svc模式,根据ARM架构参考手册,处理器有七种工作模式:

英特尔10nm制程迟到,7nm制程却并未受阻碍?

英特尔的10nm工艺技术最初计划在2016年下半年进入量产阶段,至今仍却迟未被公司使用,目前,该制程仅用于生产少量CPU,毫无疑问地,英特尔在其10nm工艺上遭遇了数年的延迟,严重影响了公司的产品阵容及其业务,更造成全球CPU供货吃紧。

深度分析骁龙855性能参数,和麒麟980持平?
深度分析骁龙855性能参数,和麒麟980持平?

这一代骁龙855的CPU升级到Kryo 485,由1颗2.84GHz超核、3颗2.42GHz大核和4颗1.8GHz小核组成,其中超/大核基于Cortex A76“魔改”。整体性能相较骁龙845提升了45%,这是骁龙800家族问世以来,相邻代际间提升幅度最大的一次。

更多资讯
51单片机片内 RAM和片外 RAM该如何区分?

前边介绍单片机资源的时候,我们提到过 STC89C52 共有 512 字节的 RAM,是用来保存数据的,比如我们定义的变量都是直接存在 RAM 里边的。但是单片机的这 512 字节的 RAM在地位上并不都是平等的,而是分块的,块与块之间在物理结构和用法上都是有区别的,因此我们在使用的时候,也要注意一些问题。

基于STM32单片机发送字符串的函数

最近由于要调试一个SMS发送短信的模块,该模块需要发送一系列AT指令,且需要字符串发送,但是STM32官方给的usart.c中并没有直接发送字符串的函数,因此写了一个发送字符串的函数。

单片机usb转串口的灵敏问题如何解决?

写这篇博客,首先检讨一下自己,因为以前串口的程序,也和步进电机一样,时灵时不灵,我现在终于知道这是为什么了,因为51上有三个串口,一个公口,一个母口,一个usb转串口

51单片机智能温控器C语言源程序

这是一款51单片机智能温控器C语言源程序,程序功能:速成有时钟显示,使用DS18B20进行温度检测,控制温度可通过按键进行设置,输出通过继电器械驱动加热器进行加热。是一款功能较为完善的温度控制板,适合单片机爱好者进行温度控制的电子制作实作项目。电路简单,容易制作,调试容易。

影响PIC单片机功耗主要有以下几个因素

最近一周一直在做pic单片机功耗问题。由于项目使用电池供电,所以功耗问题显得非常重要。根据数据手册以及网络上的资料,影响单片机功耗主要由以下几个因素: