加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 4纳米处理器,层出不穷
    • CPU、GPU哪家强?
    • 复古游戏机的芯片进化
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

拆遍最新CPU、GPU,看先进半导体发展到哪了?

2023/05/16
5897
阅读需 12 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

4纳米处理器,层出不穷

从2022年第4季度到2023年第1季度,市面上推出了许多新的处理器。Techanalye已经获得并拆解分析了大多数商业化的处理器,有时我们也会分析那些因客户要求而极难获得的产品,但我们通常会对有足够商业规模的芯片进行并列比较。我们预计2023年将看到应用新一代3nm工艺的产品首次亮相。截至2023年5月,最先进的制造技术是4nm,许多4nm的处理器在智能手机和PC领域得到广泛应用。

表 1 比较了联发科2022年底开始用于智能手机的天玑 9200 处理器(平台名称;处理器型号名称 MT6985)和高通的骁龙 8 Gen 2(处理器型号名称 SM8550)。


表 1:天玑9200与骁龙8 Gen 2 ;来源:Techanalye报告

两者都使用了POP(Package On Package),可在同一封装体内集成逻辑和存储器件,即LPDDR5被堆叠在处理器封装顶部的一个独立封装中。在高端智能手机处理器中,LPDDR5的容量为12GB,价格稍低的型号也存在8GB的容量。基于同一处理器的POP,在装载内存方面可以分为不同的规格,是提供多种型号的有效方式。

在4nm一代产品中,大部分智能手机平台都使用POP。 联发科的天玑 9200 和高通的骁龙 8 Gen 2 都是由台积电的4nm工艺制造的。然而,联发科的处理器的工艺被称为一种名为N4P的高性能制造工艺,而高通的骁龙 8 Gen 2则与其第一代的4nm处理器(2022年的骁龙8 Gen1)相同,仍是N4工艺。

值得注意的是,高通芯片采用"N4"也能实现高性能。

两种处理器的面积几乎相同,功能也几乎相同,不过在引进的IP(知识产权)和自己的IP方面,两家公司存在差异。

与使用更高工艺制造的联发科相比,高通的频率和调制解调器传输速度更高。SoC(系统级芯片)处理器的许多功能没有那么快,比如许多周边功能:如显示单元、视频和音频系统,都比CPU速度慢,高速运行的高性能CPU最多只占芯片面积的百分之几左右。只有高速CPU部分可以通过使用稍大的元件(具体是指具有大量FinFET和高速SRAM的单元)来提高速度,因此如果应用尖端的N4P工艺,大多数低频部分可能会出现性能过剩。此外,因为可以原封不动地利用以前产品的设计,高通可能再次使用N4,骁龙 8 Gen 2还有一个值得注意的特点:四层CPU架构。

CPU、GPU哪家强?

比较天玑 9200 和骁龙 8 代 2 CPU

图1比较了天玑 9200三层CPU和骁龙 8 Gen 2四层CPU。 它们的尺寸几乎相同。 顶级CPU都使用Arm的Cortex-X3内核, 它的面积最大。在芯片中,能流动的电流越多,速度就越快,所以元件越大。


图1:天玑9200与骁龙 8 Gen 2 的比较;来源:Techanalye报告

骁龙 8 Gen 2中的Cortex-X3的工作频率为3.20 GHz,比天玑 9200 的3.05 GHz高出5%。如上所述,高通没有采用面向高速的制造工艺,而是通过使用更大的部件来实现。 因此,高通公司的Cortex-X3比联发科的大1.3倍。除了最快的Cortex-X3外,其他频率都在2GHz范围内,频率都没有达到极限,处理速度都很宽裕,所以联发科和高通的尺寸都差不多。

算上Cortex-X3,高通的处理器共有8个核心,呈1-2-2-3的层次结构:两个Cortex-A715 CPU核心,即最新的中等性能CPU核心;两个Cortex-A710中等CPU核心,即早一代的CPU核心;以及三个Cortex-A510高效CPU核心。也就是说,根据应用程序优化了速度和电力。联发科的处理器则是1-3-4的架构。即使都是成熟的智能手机处理器,很明显,两家领先公司的内容之间仍有很大差异。

比较英特尔和AMD的最新CPU

表 2 比较了英特尔在 2022 年秋季发布的第 13 代酷睿 i9 13900K 和 AMD 的 Zen 4代CPU锐龙 9 7950X横截面的分析。


表 2:酷睿 i9 13900K 与锐龙 9 7950X 来源:Techanalye报告

将整个处理器和封装进行了切割和抛光,并使用显微镜和SEM对横截面(布线宽度、空间、层数、连接结构等)进行了分析,我们发现AMD采用的是台积电的5nm制程工艺,英特尔的则是自己的Inter 7工艺(相当于10nm产品,也叫"10nm Enhanced SuperFin")。尽管有世代差异,但硅的布线层数(长距离互连的厚度,称为全局层,因为概念不同而完全不同)是一样的。

另一方面,AMD的封装中的布线层数高出20%,为12层,而英特尔为10层。无论是封装还是硅,当布线层数增加时,制造工艺和成本都会增加。AMD的芯片在可以再利用硅(通过增减CPU数可以区分出高/中/低)这一点上非常出色,但是也具有封装层数增加、硅测试增加等"增加"因素。可以看出,芯片有显著的积极方面,但也有消极方面,因此有必要意识到,它们不是万能的。

比较 NVIDIA 和 AMD 的 GPU

表3比较了NVIDIA的RTX 4090,即Ada Lovelace一代的顶级GPU,和AMD的RX 7900 XTX,即2022年底推出的RDNA 3一代的顶级GPU。


表 3:NVIDIA 的 RTX 4090 与 AMD 的 RX 7900 XTX 来源:Techanalye报告

英伟达使用台积电的4nm工艺,每个硅片上有763亿个晶体管。 另一方面,AMD采用了7个硅片的芯片配置,GPU由台积电的5nm制程制造,用于缓存的SRAM在台积电的6纳米制程上制造。这些被组合在一个总共有577亿个晶体管的封装中。

Techanalye统计销售的硅片面积发现——英伟达和AMD的量都很庞大,超过了500mm²。 使用各公司公布的晶体管数量计算得出,NVIDIA有1.24亿个晶体管/mm²,AMD有1.09亿个晶体管/mm²。AMD在CPU方面与英特尔竞争,在GPU方面又与英伟达竞争,因此最大限度地利用了便于区分产品阵容的芯片,提高了开发效率。

此外,如果SRAM和逻辑芯片在未来不能以相同的比例缩小,那么更有可能的是,为了优化硅片效率,外部缓存将被移到与处理器分开的硅片上(如果即使工艺先进,面积几乎没有变化,那么效率就很低)。此外,如果外部接口的PHY也从处理器移到独立的硅片上,极有可能出现更多硅片效率更高的情况,因此预计许多制造商将使用3nm和2nm世代的小芯片。

复古游戏机的芯片进化

图2显示了2023年3月发布的ZUIKI(瑞起)的X68000 Z的外观和主板。X68000是夏普于1987年发布的一款个人工作站产品。X68000 Z是相同形状的小型化版本,连接的鼠标和键盘与原始鼠标和键盘的大小相同。


图2:2023年3月开始交付的ZUIKI的X68000 Z 来源:Techanalye报告

里面使用的是ZUIKI Z7213处理器,用于冷却处理器的散热片上也刻有Z7213的字母。

2016年,任天堂发布了红白机(日版名:家庭电脑)的复刻版。以此为起点,世嘉、科乐美和其他公司也发布了旧游戏机的复刻模型。表4总结了这些产品的情况,包括使用ZUIKI Z7213的X68000 Z。从中可以看出,从硬件上看它们几乎是相同的,唯一的区别是DRAM供应商不同。


表4:使用ZUIKI的“Z7213”的游戏机复刻模型 来源:Techanalye报告

图3 左图:2016年任天堂红白机再版中使用的中国全志R16处理器的芯片开口和布线层剥离,右图:X68000 Z中使用的ZUIKI Z7213。R16和Z7213是几乎相同的处理器芯片,尽管可能有轻微的差异(保险丝的变化等)。


图3:全志的R16和ZUIKI的Z7213 来源:Techanalye报告

图4 比较了1987 年原始X68000中使用的 HD68HC000 CPU 与 2023 年 X68000Z 中使用的 ZUIKI Z7213。


图4:全志的R16和ZUIKI的Z7213 来源:Techanalye报告

笔者的整个职业生涯都是在半导体行业度过的,因此对原版芯片有更多的看法,但在这里就不提了。复刻的游戏机版本所使用的芯片在各方面都有了进化,在性能上也完全不同。

来源:内容由芯世相(ID:xinpianlaosiji)编译自「EE Times Japan」, 作者:清水洋治

 

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
MC56F8323VFBE 1 Freescale Semiconductor 16-bit DSC, 56800E core, 32KB Flash, 60MHz, QFP 64

ECAD模型

下载ECAD模型
$14.69 查看
ATXMEGA32A4U-AU 1 Microchip Technology Inc IC MCU 8BIT 32KB FLASH 44TQFP

ECAD模型

下载ECAD模型
$3.78 查看
STM32H743VIT6 1 STMicroelectronics High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals

ECAD模型

下载ECAD模型
$20.56 查看

相关推荐

电子产业图谱

芯片电子元器件IC半导体分销教科书式必读公众号【芯世相】;国产替换,供应链配套,借展出海,方案买卖就找芯片超人。