加速器已经无处不在:世界上的比特币是由旨在加速这种加密货币的关键算法的芯片采矿得来,几乎每一种能发出声音的数字产品都使用硬连线音频解码器,数十家初创公司正在追逐能让深度学习 AI 无处不在的快速硅。这种专用化,使得各类原本运行在通用 CPU 之上的软件及其内部常见算法得以在定制化硬件上带来更快的处理速度,被认为是摩尔定律失效之后,我们能够在接下来一到两代芯片当中继续驱动计算能力保持增长的一种方法。
 
但这不会奏效。至少,它不会长时间奏效。这是普林斯顿大学电气工程副教授 David Wentzlaff 和他的博士生 Adi Fuchs 即将在本月的 IEEE 高性能计算机架构国际研讨会(IEEE International Symposium on High-Performance Computer Architecture )上发表的研究结论。他们计算出,芯片专用化不能产生摩尔定律所能产生的那种收益。换句话说,加速器的发展会像晶体管的缩小那样碰壁,而且这会比预期的更快发生。
 
为了证明他们的观点,Fuchs 和 Wentzlaff 必须弄清楚最近的性能提升有多少来自芯片专用化调整,有多少来自摩尔定律本身。这意味着要检查 1000 多份芯片数据表,弄清楚一代又一代芯片的改进有多少部分要归功于更好的算法和更巧妙电路的巧妙实现方法。换句话说,他们试图量化人类的聪明才智。
 
为此,他们做了工程师们擅长的事:他们将它转换为一个无量纲的量。他们将其称为芯片专用化回报,希望借此回答这样一个问题:“在晶体管的固定物理预算下,芯片的计算能力提高了多少?”
 
使用该指标,他们评估了特定应用集成电路(简称 ASIC)上的视频解码、GPU 上的游戏帧速率、FPGA 上的卷积神经网络以及 ASIC 上的比特币采矿。结果并不令人振奋:专用芯片的增益很大程度上取决于每平方毫米硅上可用晶体管数量的增加。换句话说,离开了摩尔定律,芯片专用化本身的力量是有限的。
 
因此,如果专用化无法给出理想的答案,那么未来的出路在哪里?Wentzlaff 建议半导体业界学习使用那些能够在逻辑停止时仍可实现扩展的东西进行计算。例如,每平方厘米可用闪存的比特数在不受摩尔定律影响的情况下持续增长,因为业界已经转向使用能够制造出 256 层甚至更高单元层数的 3-D 技术。Fuchs 和 Wentzlaff 已经开始研究这个问题,他们开发了一种计算机架构,通过让处理器查找存储在内存中的先前计算而不是重新计算它们来加速计算。
 
摩尔定律的终结“不是世界末日。”Wentzlaff 说。“但我们需要为此做好准备。”