算力提升推动机柜的功率密度越来越高,英伟达GB200 NVL72单机柜功率120kW, GB300 NVL72单机柜功率132kW,未来基于Rubin架构的VR200 NVL系列,以及基于Rubin Ultra架构的VR300 NVL系列,单机柜功率将会达到数百千瓦甚至1MW。
国内正在推进芯片国产化替代,涌现出华为、寒武纪、摩尔线程等一系列技术厂商。与英伟达相比,国内芯片的工艺制程相对落后,单卡算力相对偏低,会在超节点和集群上寻求突破。华为发布的昇腾384超节点单机柜功率已经达到42kW,未来随着芯片技术的迭代,单机柜功率将会更高。
图 中国AI算力发展趋势
机柜功率密度的提升给数据中心带来很多问题,主要表现在以下几个方面:
1、柜内电源的布置问题
机柜功率提升后,在电压不变的情况下电流增加,以1000kW的机柜为例,如果采用三相AC380V,每相电流是1515A,不论是采用PDU还是铜排给服务器供电,机柜内都没有足够的空间布置,如果采用机架式PSU,机柜内将没有空间放置服务器。
2、灰白区占比问题
以一个20MW的数据中心为例,如果每机柜功率15kW时数据中心的灰区与白区比值是1:1,那么当每机柜功率提升到60kW时,供电和制冷方案不变的情况下,灰区与白区比值可能会变为4:1。照此推算,如果机柜功率密度继续提升,而数据中心的供电和制冷方案还不改变,那么灰区占比会越来越高,比例将严重失衡。
3、供电效率提升的瓶颈问题
传统供电系统的架构已经基本确定,各设备的效率已经接近极限,机柜功率密度提升后,传输电流更大,线路损耗也就更大,产生的热量也会更多,影响数据中心供电效率的同时也将给制冷带来更多的压力。
要想避免以上问题,提升数据中心的供电电压是一个有效途径,随着机柜功率密度的提升,逐步提升供电电压的等级。电压提升后,电流变小,机柜内的供电布置和传输损耗等问题都会得到改善,同时电压的提升有机会提升供电设备的功率密度,减少设备节点,所以节省占地面积,进而改善数据中心的灰白区比例。
提升数据中心供电电压的方式有两种,一是交流,二是直流。
交流方式在国外已经在探索,将目前的三相AC480V提升到三相AC600V,仍然由UPS实现。因为AC600V与AC480V相差不大,原来的功率器件很多还可以通用,也都在交流低压范围内,不违反相关的规范,所以实现起来比较容易。但是,因为电压提升不多,它仅能适用于机柜功率密度提升不高的情况。同时,以英伟达为首的AI用户已经明确提出引入直流供电,2027年普及DC800V应用,所以预测未来的国外AI市场将会以DC800V供电为主,AC600V会在一些改造或者功率密度不是很高的中小型数据中心作为直流供电方案的补充使用。
对于国内来说,由AC380V提升到AC600V或者AC690V跨度有些大,在现有UPS基础上改动起来相对复杂,同时它的电压提升又具有一定的局限性,AC690V以上就会步入中压区,因此被采用的可能性很小。而基于直流技术的电压提升会容易很多,具有成熟的技术和设备基础,所以DC800V或者±400V将会是未来的发展趋势,其中±400V可以作为DC800V使用,也可以作为DC400V使用。
图 机柜功率与供电电压的匹配关系
文章节选自《数据中心800V直流供电技术白皮书》(2.0)
近日,中国工程建设标准化协会(CECS)正式印发《2025年第二批协会标准制定(修订)计划》。在此次计划中,归口于数据中心专业委员会的《数据中心直流供电系统技术规程》已成功纳入计划并于1月22日在北京召开了编制组成立暨第一次工作会议。该标准由中数智慧(北京)信息技术研究院有限公司和中讯邮电咨询设计院有限公司主编,主要参编单位有:抖音视界有限公司、北京快手科技有限公司、深圳市腾讯计算机系统有限公司、阿里云计算有限公司、北京世纪互联宽带数据中心有限公司、普洛斯普瑞数据科技(上海)有限公司、世源科技工程有限公司、华信咨询设计研究院有限公司、中达电通股份有限公司、沈阳微控飞轮技术股份有限公司、合肥阳光源智科技有限公司、南京博兰得电子科技有限公司、施耐德电气(中国)有限公司等。
该标准适用于新建、改建及扩建数据中心的直流供电系统的设计、施工及验收。诚邀在数据中心供配电技术领域拥有卓越实践经验的单位共同参与,携手打造引领行业发展的标杆性成果。
联系人:罗育茜,13716595411(同微信)
364