• 正文
  • 相关推荐
申请入驻 产业图谱

大算力GPU的高效供电:从电源架构设计到器件选型,一文讲透!

9小时前
217
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

针对大算力GPU,如当前主流的AI加速卡、大模型训练集群节点,电源管理已经从“配套边缘”变成了决定算力上限的“核心瓶颈”。

在几百瓦甚至突破千瓦的单芯片功耗下,GPU核心电压(Vcore)通常低于1V,这意味着核心电流往往超过1000A,且瞬间电流突变率(di/dt)可高达1000A/μs以上。传统的12V多相降压架构在这种极端的瞬态响应和巨大的I²R损耗面前已无法满足需求。

那么,大算力的GPU选取什么样的电源架构,才能满足其高能效的需求呢?

大算力GPU核心电源架构演进

为了应对“千安级”电流,当前的GPU电源架构主要沿着两个维度突围,即拓扑创新与空间物理位置的革新。以下为大算力GPU当前主流的三大高能效电源管理架构:

TLVR(跨导电感电压调节器)——当前主流的横向供电架构

在传统多相降压转换器拓扑中,电感值在稳定状态下和瞬态事件期间是恒定的。因此,选择电感值时需要在瞬态响应、功率损耗以及电压纹波和电流纹波之间进行权衡。为了兼顾效率和减小电流纹波,电感值不能太小;但电感大了,瞬态响应就慢,GPU瞬间拉载时电压会暴跌。

TLVR拓扑源自多相半桥降压转换器拓扑,但将每个相位的单绕组电感器替换为双绕组耦合电感器,当GPU发生巨大瞬态负载时,TLVR能够让所有电源相在极短时间内(几十纳秒级)同时响应,瞬间产生巨大的电流。这极大地减少了对主板输出电容数量的依赖,节省了GPU周边的宝贵空间。

英飞凌TDM24745T是一款OptiMOS四相AI电源模块,该模块将四个功率级、TLVR电感和解耦电容集成到紧凑的9x10x5mm³封装中,电流密度高达2 A/mm²以上,拥有高达320A的峰值电流能力,特别适用于下一代AI处理器和高电流多处理器平台。

图2:四相AI功率模块TDM24745T(图源:Infineon

48V两级转换架构——大算力GPU的标

传统数据中心服务器主板采用12V配电。但随着单机柜功率突破数十千瓦,12V传输会产生极大的电流和线损。当前最前沿的架构,如Google主导的开放计算项目OCP架构,直接将48V引入主板,甚至直接通过单级或极少级数的转换送到处理器(PoL)。相比12V,48V在相同功率下电流降为1/4,传输损耗理论上可降至1/16。

在实际应用的电源方案中,从能效和散热等角度考虑,并不会选择一步到位将48V直接降至GPU核心所需的0.8V,而是采用两级转换策略。48V两级转换方案具有更高效率、更低成本和可调性优势。其工作过程是首先将VIN电源(48V)直接送到加速卡边缘——通常先用一个高密度、无稳压的开关电容转换器(STC)或LLC谐振变换器,以接近98%的效率将48V降为12V左右的中间电压;然后,再由紧靠GPU的传统多相Buck(通常结合TLVR)完成12V到0.8V的精准稳压。随着输入电压的降低,这些多相变换器的峰值效率可高达约97%。

EPC9159是一款1kW、48V/12V固定比的微型转换器,可实现5130W/in3的功率密度。在48V功率级EPC9159采用100V的EPC2619e GaN FET,而在12V功率级采用的是40V的EPC2067。该转换器基于LLC拓扑,由初级侧全桥、固定比率平面变压器、次级中心同步整流器组成。初级侧全桥使用4个EPC2619,次级侧使用6个EPC2067。这款产品专为高功率密度48V服务器电源DC/DC转换器而设计。

图3:完成组装的EPC9159KITT参考设计(图源:EPC)

VPD(垂直供电架构)——未来的终极形态

现代GPU有数百亿个晶体管,在大幅提升处理器性能的同时,其代价是电源需求的指数级增长。即使把电源芯片贴在GPU四周(横向供电),从电源到GPU硅片之间几厘米的PCB铜箔走线在1000A电流下也会产生几十毫伏的压降和巨大的发热。

目前看来,垂直供电是以最低PDN(电源分配网络)阻抗在处理器内核低电压下提供大电流的未来终极方式。在这种架构中,电流倍增器和旁路电容器一起堆叠,形成一个集成电源模块,可取代旁路电容器组合。电源模块将直接安装在GPU封装的正背面(主板另一侧),电流通过主板的过孔垂直向上直接注入GPU。此举可将供电路径从“厘米级”缩短到“毫米级”,彻底消除主板走线的寄生电阻,PDN损耗可减少80%以上。

Vicor推出的面向直接由48V供电的高性能GPU、CPU和ASIC(XPU)处理器的ChiP-set模块,是VPD架构的代表性产品。它由一个驱动器模块MCD4609和一对电流倍增器模块MCM4609组成,可提供高达650A的持续电流和1200A的峰值电流。电流倍增器不仅能够提供超过1000A的大电流,还可让PDN阻抗锐降50倍。极小的空间占用使得电流倍增器可部署在靠近处理器的位置,不仅能显著降低PDN损耗,而且还能提高电源系统效率,电流密度达到2A/mm2。通过“最后一英寸”供电,Vicor 4609 ChiP-set克服了为高功率处理器进行大电流传输造成的障碍。

图4:合封ChiP-set模块的AI加速卡(图源:Vicor)

48V两级转换架构设计及器件选型

在算力功耗动辄突破1000W的今天,直接将48V转换为0.8V核心电压面临着极大的物理挑战。如果是48V转0.8V,占空比仅为1.6%。在几百kHz甚至MHz的开关频率下,极窄的导通时间会导致巨大的开关损耗,且瞬态响应极差。

因此,48V两级转换架构成为当前大算力系统的主流方案。它将“高压变压”和“精准稳压”解耦,由两级电路各司其职。以下是针对该架构设计方案中主要器件选型的一些建议:

第一级:中间总线转换器

第一级的核心任务是按比例降压(DCX)和提供隔离(可选),它通常不负责精准的电压调节,而是以最高效率将48V降压。LLC谐振变换器利用电感和电容的谐振,实现开关管的零电压开通(ZVS)和零电流关断(ZCS),效率极高(通常>98%),具备电气隔离能力,技术成熟。但必须使用体积较大的变压器和谐振电感,在GPU寸土寸金的板级空间上较难布局,通常做成垂直插卡的模块(如OCP标准的非稳压隔离模块)。开关电容/开关储能转换器(STC)依靠电容组和MOSFET阵列进行电荷转移来实现按比例降压(如4:1降至12V,或8:1降至6V)。没有大体积的电感,功率密度极高,可以做得非常薄,紧贴甚至埋入主板。但不具备隔离功能,启动时有浪涌电流问题,需软启动设计。这种是目前AI硬件企业非常青睐的板上第一级方案。

控制器的选择:需选专用的LLC数字控制器或STC控制器。Texas Instruments、MPS、Renesas、Infineon均有专门针对48V至12V/6V的LLC、STC控制器芯片。Infineon的XDPP1100是标准48V至12V隔离DC/DC转换器,这是一款自带Cortex-M0内核的高端数字电源控制器,全面支持PMBus,适用于隔离式DC/DC电源应用。

图6:XDPP1100 48V至12V隔离DC/DC转换器(图源:Infineon)

功率器件(FETs)的选择:48V侧推荐使用80V-100V的GaN FET(EPC、Infineon均有相应的产品)或极低RDS(on)的硅基MOSFET。GaN在此频段的无反向恢复电荷特性可将效率推向99%。例如,专为48V中间总线架构设计的EPC2367,其RDS(on)低至1.2mΩ。

无源器件的选择:STC拓扑对电容要求极高,必须使用低ESR、耐高频纹波的X7R/X7T MLCC(多层陶瓷电容)。

第二级:负载点稳压器

第二级的核心任务是精准稳压和应对极端瞬态(di/dt),它直接面对要求严苛的GPU核心。传统多相降压可将12V或6V中间电压降至0.8V,相数通常在8相到24相甚至更多。如果第一级降至12V,中间总线电流较小,PCB走线容易;如果降至6V,第二级的降压比更大(6V降0.8V远比12V降0.8V轻松),第二级效率更高,但6V总线电流翻倍,考验主板铺铜能力。

TLVR在多相Buck的基础上,将各相电感耦合,以牺牲极小效率的代价,换取优异的瞬态响应速度,是目前顶配AI卡的标配。所选择的器件,必须具备PMBus/AVSBus通信能力,建议选择具备非线性控制算法(如MPS的恒定导通时间COT算法)的高端系列。

TLVR电感则需选用低损耗铁氧体材质的双绕组电感,确保主绕组DCR<0.2mΩ。

本文小结

随着人工智能(AI)、大型数据中心、新能源汽车以及边缘计算的飞速发展,系统对算力的要求呈指数级增长,随之而来的功耗问题使得高能效电源管理架构成为当前硬件设计的核心技术壁垒。

以目前主流的产品为例,单颗数据中心GPU的功耗已经从700W(H100)飙升至1000W甚至1200W(B200),传统12V架构早已无法承受巨大的电流和线损。采用48V电源可将输入电流降至20A左右,大幅降低了PDN的损耗。然而,一步到位地将48V直接降至GPU核心所需的0.8V,单级降压占空比又太小,极难控制且效率低下。两级转换架构完美解耦了这个矛盾。

OCP组织已将48V确立为下一代机柜的标准配电电压。接下来,48V两级转换架构不仅会成为应用的主流,它实质上已经是大算力GPU的标配,并在未来3-5年内的数据中心市场占据主导地位。

不过,合理的架构也需要满足要求的器件才能实现目标性能。因此,选择合适的电源器件是发挥GPU大算力的重要一环,值得我们花时间去研究。

该发布文章为独家原创文章,转载请注明来源。对于未经许可的复制和不符合要求的转载我们将保留依法追究法律责任的权利。

贸泽电子

贸泽电子

贸泽电子是原厂授权的全球半导体和电子元器件代理商,专注于从授权制造商快速引进新产品和新技术,为新设计以及制造供应链提供支持。

贸泽电子是原厂授权的全球半导体和电子元器件代理商,专注于从授权制造商快速引进新产品和新技术,为新设计以及制造供应链提供支持。收起

查看更多

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

贸泽电子(Mouser Electronics)是全球授权半导体和电子元器件代理商,致力于以高效的方式向电子设计工程师和采购推广新一代产品和新技术,全面支持研发阶段的采购。Mouser.cn一个芯片也可出货,新一代产品信息和技术内容每日更新,可在线搜寻超过 1200 家品牌制造商的 3100 多万种产品,其中680 多万种产品可直接在线订购,产品涵盖的应用领域包括工业、机器人技术、物联网、新能源、汽车电子等。想深入了解贸泽电子,请访问:http://www.mouser.cn