何为晶圆级处理器?其性能有多大提升?

2019-02-20 15:04:30 来源:EEFOCUS
标签:

用整个硅片来制造处理器似乎是一个奇怪的想法,但一项新的研究表明,晶圆级芯片可以比同等的多芯片模块MCM的性能好一个数量级,同时提供更好的能效。

 

晶圆级集成(WSI)的概念相当简单:不是制造一个装满芯片的晶圆,而是将它们分开,然后将它们重新连接在一起,放在多芯片模块或封装的印刷电路板(PCB)上,晶圆本身可以作为“超级芯片”的衬底,将各个元件连接在一起就位。从理论上讲,这应该可以降低成本(消除单个芯片的封装)并提高性能(通过接近组件可以实现更快的数据速率)。

 

 

WSI还可以构建更密集的设备。在一个电路板中,有90%甚至更多的空间用于非模组件。据英特尔称,芯片到芯片通信的I/O电路已占据某些处理器面积的25%以上。对于晶圆级设备,互连只会占用不到10%的面积。

 

制造晶圆级芯片的想法已经存在一段时间了,其中最著名的尝试之一是在1980年,当时Gene Amdahl试图构建一个大型机晶圆级计算机芯片,作为他新成立的创业公司Trilogy Systems的基础。与20世纪70年代和80年代WSI的其他失败的尝试一样,Amdahl失败的主要原因是当时的半导体制造产量不足以生产足够数量的可用晶圆。

 

从那时起,制造业有了显著进步,新技术的出现为WSI提供了一些有趣的可能性。特别是,研究人员指出,现在可以将处理器,存储器模块(包括3D DRAM堆栈)甚至外围设备的高产量裸片连接到一块晶圆上,并使用一种新的晶圆级互连技术将它们连接起来,这种技术被称为硅互连结构(Si-IF)。

 

今天讨论的这项研究是由来自加利福尼亚大学洛杉矶分校(UCLA)和伊利诺伊大学厄巴纳 - 香槟分校(UICU)的一组研究人员进行,在题为“构建晶片级处理器 - GPU案例研究”的论文中进行了描述。

 

在加州大学洛杉矶分校开发的Si-IF技术尽管不如片上连接好,但也提供了比封装级互联更好的带宽,延迟和能源效率。Si-IF基材与铜柱I/O引脚和模间连接集成,成为晶圆片的高性能数据管道。实质上,Si-IF用硅衬底代替PCB,并允许模具直接连接到晶圆上。

 


目前市面上有很多商用的多模互连技术,如台积电的基板晶圆芯片(CoWoS)和英特尔的嵌入式多模互连桥(EMIB),但据研究人员称,这些技术的可扩展性有限。目前最大的CoWoS设备只有一个GPU和四个内存堆栈,而EMIB技术只能连接大约5到10个芯片。

 

为了展示技术的成熟程度,研究人员构建了一个100mm的原型晶圆,其中10个4mm²的模具连接到Si-IF基片上,并连接40000个铜I/O引脚。在测试模具之间的电气连接时,他们确定所有支柱引脚和管芯间链路工作正常。研究人员在报告中写道:“我们在这种原型上观察到的高产量,再加上之前报道的用于在Si-IF上连接模具的高产量,证明了制造晶圆级系统的技术准备已经就绪。” 注意,这里的模具是单独“预制”的,它们没有直接蚀刻在晶圆上。

 

该研究的其余部分涉及将“假设的”晶圆级GPU与各种配置的单芯片和多芯片GPU(在这种情况下,每个封装四个GPU模块)进行比较。研究人员选择GPU作为案例研究的基础,因为在GPU上运行的应用程序在本质上是高度并行的,因此GPU是展示多模集成优势的良好架构。为了测量应用程序的性能,研究人员选择了7种不同的基准测试,包括物理模拟,机器学习,线性代数,医学成像,图形着色和社交媒体。


与40-MCM的扩展配置(10个4-GPU封装电路板)相比,40-GPU的芯片平均运行速度提高了5.2倍,最高可达18.9倍。24-GPU晶圆比竞争对手(6块4-GPU封装板)平均高出2.3倍,最高为10.9倍。研究人员将这种加速归因于Si-IF在MCM配置下比车载网络更高的数据带宽。

 

同样的,基于能量延迟功率(EDP)指标,与MCM晶圆相比,假设的GPU晶圆表现出更好运行基准的能量分布。仿真结果表明,24-GPU和40-GPU晶圆的节能效果分别提高了9.3倍和22.5倍。研究人员认为,在晶圆级硬件上可以获得更好的结果,大大缩短了执行时间,并提高了晶圆级通信的能效。

 

他们设计的晶圆GPU以相对适中的时钟速度运行:24-GPU版本为575 MHz,40-GPU版本为408 MHz。研究人员声称,如果可以使用更高的频率,它们的性能优势也会增加,尽管提升幅度不大:1 GHz 24-GPU晶圆的性能将比扩展后的24-MCM晶圆多出7%。

 

本文只提到了WSI的一个关键优势,即每个多GPU晶圆在软件上都是一个超大尺寸的GPU。即使性能和能源优势非常有限,但是程序员生产力的提高本身可能会使这种技术对开发人员具有极大的吸引力。

 

WSI是否能够从大学实验室中脱颖而出还有待观察,商业可行性通常是一件棘手的事情,即使是那些似乎即将实现产品化的技术。如果这些研究人员真的相信waferscale已准备好进入黄金时段,那么可能就会出现一个附带结果。

 

 

与非网编译内容,未经许可,不得转载!

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
与非网 小编
与非网 小编

电子行业垂直媒体--与非网小编一枚,愿从海量行业资讯中淘得几粒金沙,与你分享!

继续阅读
大胆假设:如果孙正义吩咐Arm公司授权IP给华为
大胆假设:如果孙正义吩咐Arm公司授权IP给华为

如果ARM的老板孙正义告诉ARM的CEO,让他把IP授权给中国,你觉得这位CEO会怎么做?

AMD大翻身,预计第三季度推出基于Zen2架构的Ryzen 3000处理器

AMD 50年的历程中,有26年都位居世界五百强的名单中。但自从AMD十年前开始在CPU领域上频频失利后,市场份额不断缩水,最终在2015年掉出了五百强的名单。

随着GPU服务器销售数据爆炸增长,AI市场将会如何发展?

没有比服务器数据更精准、更直观,更能体现风向。 今日,IDC发布的《2018年中国AI基础设施市场数据报告》,披露了AI服务器市场方面的最新进展。

还是AMD,Google 云游戏平台Stadia选用1代Vega GPU

Google表示,Stadia平台配备了定制版的Intel至强处理器,主频2.7GHz,二三级缓存9.5MB,支持AVX2指令集,可能是四核心八线程。

Intel首席架构师Raja:架构提升应对制程进步减缓

如果想实现指数级的增长,必须要硬件和软件共同创新,且两者的相互交流,比以往任何时候都更重要。

更多资讯
郭台铭:受贸易战影响,各供应链厂商将更强、更弹性

鸿海董事长郭台铭表示,因为贸易战,全球供应链将重新架构,包括工业制造供应链将在不同区域重新建立。

华为遭遇各种“打压”,这是场迟早要打的阵地战?

从目前已知的消息来看,Google暂停与华为的商业合作(禁令延迟90天实施)、英国两大主流通讯运营商EE和Vodafone相继宣布“暂停”开售华为5G手机、微软在线商店下架华为MateBook X Pro。

华为遇制裁以来最大挑战,这次关乎未来创新
华为遇制裁以来最大挑战,这次关乎未来创新

美国的出手策略似乎是由浅入深的,从芯片到系统到架构,这一次真正到了产业最最核心的部分,那就是标准协议。

ARM 为何也对华为采取禁运措施?如此现状华为又将采取怎样的措施?

日前,BBC透露,英国芯片设计公司ARM已告知员工,必须暂停和华为的业务往来。ARM要员工停止和华为及其子公司的“所有有效合同、支持权利和任何待定合作”,以遵守最近的美国贸易禁令。在一份公司备忘录中,该公司称其设计包含“美国原产技术”,虽然ARM不是美国的公司,也会受到特朗普政府禁令的影响。

三星与高通和解协议被泄露,这些材料或将需要重新密封

手机制造商三星于美国当地时间周三提交了一份紧急动议,要求修改其与芯片制造商高通(Qualcomm)达成的和解协议中“高度敏感和机密细节”。此前,该和解协议内容被“无意中”泄露。

电路方案