TPU、Maia、Trainium、MTIA:四大云厂商围堵英伟达,推理算力不再姓“黄”?
AI加速器市场在未来十年将出现明显的分化,通用GPU(如英伟达)将继续主导训练市场,而定制ASIC(如云厂商自研)则将在推理市场占据主导地位。预计到2033年,AI加速器市场的总规模将达到6040亿美元,其中通用GPU的年复合增长率约为16.1%,而定制ASIC的增长率为44.6%。 四大云厂商(谷歌、微软、亚马逊、Meta)纷纷推出自家定制的AI加速器,如谷歌的TPU v7 Ironwood、微软的Maia 200、亚马逊的Trainium 3和Meta的MTIA。这些芯片在性能、功耗和成本方面各有优势,特别是定制ASIC在推理领域的成本效益更为突出。 英伟达推出了Vera Rubin架构,试图在推理市场上夺回部分市场份额,但面对定制ASIC的竞争,英伟达的CUDA生态系统仍然是其主要优势。然而,随着定制ASIC的普及,英伟达在推理市场的份额可能会大幅下降。 此外,台积电的3nm工艺成为各大厂商争夺的关键资源,导致芯片产能紧张。数据中心的基础设施也需要相应调整,以适应不同类型的AI加速器,包括散热、互联和组网等方面的变化。 对于基础设施规划师、运维团队和战略决策者而言,未来的数据中心将面临更多挑战,需要制定相应的应对策略,以确保高效运行。