GPU粥少僧多，真的要延后出货吗？

作者：畅秋

过去一年，用于AI 服务器的GPU一直供不应求，而从未来一年的发展态势来看，相关产品的紧张程度有增无减。

据TrendForce（集邦咨询）预测，2024年全球服务器整机出货量约1365.4万台，年增长率约2.05%。同时，市场仍聚焦部署AI服务器，出货占比约为12.1%。

从各大ODM出货动态来看，今年，增长幅度最高的是Foxconn（富士康），预估出货量年增约5%~7%，包含Dell 16G平台、AWS Graviton 3与4、Google Genoa和Microsoft Gen9等订单。AI服务器订单方面，Foxconn今年已斩获Oracle订单，同时也承接了部分AWS订单。

增长幅度排名第二的是Inventec，预估出货量年增约0~3%。AI服务器方面，除了北美CSP，中国客户，如ByteDance需求最强，预估今年Inventec 的AI服务器出货量年增长率可达双位数，占比约10%~15%。

排在Inventec之后的是广达和Supermicro，预计今年服务器出货量年增长率持平。

整体而言，各家ODM在2024年的出货仍以AI服务器最为强劲，主要受惠于北美云端数据中心厂商订单带动，预计今年AI服务器出货增长率和占比都将达到两位数百分比。就出货种类而言，今年，搭载高端AI训练芯片（如英伟达H系列和AMD的MI系列产品）的机种出货量有机会翻倍增长。这对英伟达和AMD来说，意味着更大商机。

店大欺客？

目前，英伟达占据80%的AI服务器GPU芯片市场份额，AI系统和互联网大厂都需要该公司的GPU，因此，英伟达在该市场拥有很大话语权。

最近，有外媒报道，英伟达可能刻意延后出货，以限制竞争对手接单。

报道称，如果英伟达发现客户正在寻求更好的业务机会，则可能会拖延数据中心GPU的出货。英伟达的竞争对手、人工智能芯片创业公司Groq表示，由于客户担心英伟达报复性出货延迟，都心存恐惧地对取得或设计人工智能技术保密。

Groq首席执行官罗斯（Jonathan Ross）表示，由于潜在客户担心被英伟达发现与其它厂商讨论接单，客户们都会否认自己曾与这些竞争对手公司会面。实际上，这种情况在业界并不少见。罗斯说：“很多人都说，如果英伟达听说客户正在会面，它们会否认这一点。问题是你必须提前一年向英伟达付款，可能会在一年内得到硬件，也可能需要更长时间。”

外媒甚至暗示，微软、Google和亚马逊等科技巨头正打造自有人工智能加速器，但都坚称不打算成为英伟达的竞争对手，因为英伟达在人工智能市场中占有主导地位。

针对罗斯的声明，英伟达CEO黄仁勋告诉行业分析师，他试图公平地向客户分配GPU，并将避免向不立即使用加速器的公司出售产品。

在Groq指控英伟达使用延后出货手段后，AMD前副总裁赫克尔曼（Scott Herkelman）表示，英伟达的确采取类似策略，他甚至称英伟达为“GPU独占集团”。他在社交媒体X上发文写道：“这种情况发生的次数比预期的要多。”

赫克尔曼的表态十分引人关注，因为他从2016年起负责AMD的图形业务部门，该部门在消费者和数据中心业务方面与英伟达竞争，直到2023年离开AMD。更重要的是，他在2012年9月~2015年5月间担任英伟达GeForce业务总经理。

不过，目前尚不清楚是否有证据证明英伟达确实有上述行为。

如何保持行业领导地位？

英伟达在占据AI服务器用GPU市场主动地位的情况下，一定会想方设法实现利润最大化，具体措施方面，除了高定价，保持客户粘性是很重要的方式，在这方面的具体措施，包括技术性的，如用CUDA软硬件生态系统牢牢地抓住广大工程师，还有就是商业操作层面的，要尽量降低竞争对手的获客机会。

在当前的AI服务器和相关GPU市场行情下，无论是GPU提供商，还是系统集成商或互联网大厂，都越来越敏感了，特别是互联网大厂，都在做两手准备，在向英伟达采购更多GPU的同时，正在加紧自研相关芯片。对于英伟达的各种客户而言，更多地接触AMD和英特尔是必然。

微软、Meta、亚马逊等云服务提供商为了降低芯片成本，并使芯片供应链多元化，减少对英伟达的依赖，不仅开始提升采购AMD的MI300系列产品数量，要求ODM厂设计专门采用MI300系列产品的AI服务器，还纷纷加强自研HPC芯片力度，争取将更多自研芯片用于自家的互联网和云计算系统。

AMD是英伟达最大的竞争对手，由于受到越来越多英伟达客户的关注，对AMD产品的采购量在增加，使得该GPU“二哥”的行业地位持续提升，这在资本市场上有越来越明显的表现。最近，AMD股价涨幅超过9%至每股192.53美元，创造历史新高，2月份累计上涨了14.8%，市值首度突破3000亿美元。

根据道琼斯市场数据，AMD的市值达到了3110亿美元。在近期的连续上涨之后，AMD股价越来越贵，其市盈率接近50倍，远高于英伟达的32倍。

这样看来，虽然英伟达依然很风光，但受限于先进制程、封装产能，以及来自各级别芯片对手的竞争，该公司的危机意识也在增加。

对于英伟达来说，要加快推出新品和优化原有产品的节奏。

英伟达AI年度盛会“GTC 2024”将于3月18日在美国登场，届时，黄仁勋将公布旗下最新的AI芯片、采用新一代Blackwell架构的B100 GPU。据悉，该新品将由台积电3nm制程代工生产，最快今年第四季度出货。

GTC大会不仅将世界各地的专业工程师、研究人员会聚一堂，还将邀请多位科技大老亲自到场，活动预计将涌进超过30万人（线下和线上总参与人数），今年的GTC也被外界看作是观察2024和2025年AI关键技术发展进程的重要风向标。

英伟达即将发布的B100，与目前的H系列GPU相比，整体效能有大幅提升。其中，光是HBM内存容量，就比H系列最强的H200芯片高出约40%的容量，使得B100能应对高效能HPC或加速LLM的AI训练需求。据了解，B100芯片的AI效能，至少是Hopper架构H200的两倍，可以达到H100的4倍以上。

多家AI服务器系统大厂已经开始争夺B100，包括已成为英伟达B100模组供应商的代工大厂纬创，以及提供3nm或4nm制程技术的台积电，还有现已开始接到来自英伟达B100 AI服务器水冷项目订单的代工大厂英业达。英业达表示，今年的AI服务器市场仍以英伟达产品为主流，并以高端训练用的AI服务器产品为市场主力。

对于即将发布的新品B100，英伟达对所搭载的散热技术也进行了升级，从原来的气冷转为水冷，对此，黄仁勋曾提到，自己坚信浸没式水冷技术是未来发展方向，将带动整个散热市场迎来全面的革新。据悉，英伟达从B100开始，未来所有产品的散热技术，都将由气冷转为水冷。

中国市场给英伟达增添了更多危机感

英伟达对竞争对手带给它威胁的重视程度，从它对中国大陆市场及本土芯片企业的态度就可以看出来。

中国大陆市场占英伟达销售额的20%左右，近两年，该公司不得不多次改变GPU性能规格，以满足美国政府的出口要求。

2022年8月，美国政府禁止向中国大陆出口英伟达的A100和H100芯片，因为这些芯片的通信带宽达到了600GB/s或更高。针对中国大陆市场，英伟达随后推出了A800和H800处理器，通信带宽都明显低于600GB/s。

2023年10月，美国商务部工业与安全局（BIS）表示，将使用 “性能密度”作为新参数对受限芯片进行分类。根据新规定，英伟达的A800、H800、L40、L40S和RTX 4090相关产品被禁止销往中国大陆。针对这项规定，英伟达又于去年11月推出了三款AI芯片——H20、L20和L2，但要到2024年第二季度才能量产交付。

针对RTX 4090在中国大陆销售受限问题，英伟达开发出了RTX 4090 D显卡，通过降低部份规格，以符合美国出口管制要求。据悉，RTX 4090 D满足综合运算性能（TPP）4800限制，RTX 4090的TPP是5286。

最近，英伟达推出了最新版本的中国特供GPU和显卡RTX 5880 Ada，符合4800 TPP的限制规定。英伟达将AD102芯片用于RTX 6000 Ada和RTX 5000 Ada，RTX 5880 Ada很可能使用相同芯片的变体。AD102拥有18,432个CUDA内核。

随着近几年美国限制政策的出台，以及中国本土企业和产品竞争力的提升，英伟达等厂商的技术和产品优势正在缩小。例如，H20在性能和效率上仍比中国本土AI芯片具有优势，但这种优势正在缩小，因为多家中国本土芯片厂商正在快速发展。

由于中国本土AI芯片与英伟达特供版产品之间的差距在缩小，进入2024年以来，多家中国互联网大厂和云服务提供商表示，今年下订的英伟达H20等产品数量将远少于原本想买的，因为来自中国本土的相关芯片用量增加了。

测试结果显示，H20能在多个处理器之间高效传输数据，比中国本土相关芯片更适合AI计算应用，但是，需要更多H20才能表现出英伟达常规GPU的算力，这就大幅提高了成本。相比之下，中国本土最先进的AI芯片也能处理AI相关应用，只是处理任务的复杂度低于英伟达的。知情人士表示，多家中国互联网大厂和云服务提供商已经把一些AI芯片订单转至本土厂商，以华为为例，据悉，该公司去年已从本土互联网大厂手中拿到至少5000组Ascend 910B芯片订单，预定今年交货。

2月下旬，黄仁勋在接受外媒采访时表示，如今，整个科技行业都在争相开发和优化自己的芯片技术，无论是TPU团队、AWS Trainium和Interentia团队，还是微软的Maia项目，以及中国各大云服务提供商和初创公司，都在这一领域投入了大量的精力。这种竞争态势确实非常激烈。

对于中国大陆的竞争对手，黄仁勋表示，华为是非常好的公司。尽管他们受到现有半导体制程技术的限制，但他们仍然可以通过将许多芯片聚集在一起来构建非常强大的系统。为了与华为竞争，英伟达正在向客户提供两款专门针对中国市场的新AI芯片样品。

这是英伟达首次公开将华为列为竞争对手。此前，英伟达唯一一次公开提到华为是在2017年的一份财报中，当时，该公司表示，华为将使用英伟达的Volta HGX架构为数据中心构建AI系统。在那份报告中，英伟达还将华为列为其AI智慧城市平台的合作伙伴，而现在，华为成为了英伟达不得不重视的竞争对手。

结语

经过2023年的火爆，2024年的AI服务器市场很可能会更加旺盛，这给相关高性能芯片、特别是GPU厂商提供了更多商机。

对于行业领导厂商而言，众多竞争对手，甚至包括客户都虎视眈眈。站得越高，如果处理不好的话，摔得就会越惨，需要在技术、产品和商业推广等多方面，充分发挥原有优势，压制竞争对手，才能保持行业地位。

对于英伟达来说，2024年的AI服务器GPU市场依然会是它的天下。但在不断变化、发展的高性能计算市场，谁能断定两三年后的技术和产品市场会有多大变化呢？就像两年前，谁能断定华为能在2023年实现手机处理器制造突破一样。

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
DSPIC33EP512MU814-I/PH	1	Microchip Technology Inc	16-BIT, FLASH, 60 MHz, MICROCONTROLLER, PQFP144, 16 X 16 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-144	ECAD模型下载ECAD模型	$13.09	查看
AT89C51ED2-RDTUM	1	Microchip Technology Inc	IC MCU 8BIT 64KB FLASH 64VQFP	ECAD模型下载ECAD模型	$18.07	查看
MK10DX64VLH7	1	Freescale Semiconductor	Kinetis K 32-bit MCU, ARM Cortex-M4 core, 64KB Flash, 72MHz, QFP 64		$6.77	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

DSPIC33EP512MU814-I/PH

Microchip Technology Inc

16-BIT, FLASH, 60 MHz, MICROCONTROLLER, PQFP144, 16 X 16 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-144