• 正文
  • 相关推荐
申请入驻 产业图谱

算力堆不出智能时代,新华三的“全栈”答卷靠谱吗?

13小时前
194
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

2026年,AI基础设施建设进入了高投入与高损耗并存的矛盾周期。

市场端,中国Token调用量两年激增1400倍,全球AI基础设施投入规模正向7万亿美元迈进;但工程化落地端,效率瓶颈却愈发显著。英伟达数据显示,分布式训练中的网络拥塞导致算力空转率普遍超过30%;Gartner则预测,到2027年底,超过40%的企业级智能体项目或将因落地难而被迫取消。

应用层面的反馈更为直观:据浪潮人工智能研究院测算,我国智算中心平均算力使用率仅为30%。某千卡规模项目的实际运营情况也印证了这一现状——不仅“上架率不足50%”,且已上架服务器的实际利用率也不到30%,年运营成本却高达3000万元。

这暴露了当前行业的一个核心症结:AI基础设施的建设瓶颈,早已不在单点算力芯片的性能指标,而在于计算、网络、存储、云管、安全、运维等环节之间,存在着一条尚未被系统性打通的“隐形断层”,算力墙、存储墙、功耗墙……各种说法因此产生。

系统性的“木桶效应”

“如果AI是一辆超级赛车,需要的不仅是强悍的发动机,更需要配置完整、调校优异的整车。”今年5月,在新华三集团的领航者峰会上,总裁于英涛用一个形象的比喻来拆解行业迷思。他直言,当前多数人的做法是不断换更强的发动机:“但如果变速箱打滑、轮胎漏气、油路堵塞、这辆车能跑多远?”

数据不会说谎。根据新华三公开的行业测试报告,万卡集群中数据IO瓶颈导致GPU空等时间占比可达40%以上——这意味着昂贵的算力芯片有近一半时间在等待数据搬运。网络层面的拥塞和丢包,则让跨节点通信效率大打折扣。而因安全事件、维护保障或调度失误导致的训练中断,平均恢复时间以天为单位计算。对于千卡级以上的智算集群,每一次意外停机都意味着数十万甚至上百万的直接损失。

“Token的性价比不是一张卡决定的,也不是由某一个单一能力决定的。”于英涛强调。

这并非新华三的一家之言。上海智能算力科技有限公司副总经理辛帅在峰会上分享了从零搭建万卡集群的真实历程。他将挑战归结为四个维度:规模之难——万卡级别意味着任何单点故障都可能演变为全局事故;异构之痛——不同厂商芯片的指令集和通信库各自为政,能否协同工作是个巨大问号;运维之繁——故障定位须达毫秒级、链路级;演进之惑——今天购买的设备需适配未来3~5年的模型架构。“四点中任何一点考虑不到,后面都可能推倒重来。”辛帅表示。

一场全栈的“押注”

一个愈发清晰的事实是:算力基础设施的系统协同能力,已严重滞后于芯片性能的迭代速度。大量GPU不是“跑不动”,而是“跑不满”。

面对这一困局,业界分化出了不同的解题路径。有的企业选择“往前冲”,以行业智能体打包算力、模型与场景,试图绕开底层协同的碎片化,直接交付应用价值。有的企业试图“往深扎”,将AI推理能力注入基站接入网,死磕连接层的智能化跃迁,为上层应用扫清时延障碍。也有的云厂商选择“往后退”,集体转向“水电煤”式的标准化算力租赁,按需交付弹性资源,但把系统协同的难题留给了客户自己。

新华三的选择更为激进——同时攥住计算、网络、存储、云、安全、运维六个维度,试图交出一套全栈“交钥匙”般的系统级方案。

这一思路最直观的体现在于,既然瓶颈在各环节之间的缝隙,那就把六个维度拉通来做整体优化:在算力侧,高密液冷方案将6颗CPU集成于1U标准机箱内,单机柜算力超过3万核。散热方案上,整机不依赖风扇,全部由液冷完成热交换,电能利用效率指标(PUE)可控制在1.04,这意味着电费开支中,真正用于计算的比例远高于行业平均水平;在存储层,用“以存换算”的思路把GPU从等待数据的空闲中解放出来,将大模型的历史上下文缓存到扩展内存中,将首Token延迟降低90%;在网络层,通过算网协同调度让带宽利用率从70%向90%以上爬升。

在今年5月,新华三最新发布的S80000超节点也印证了他们的技术思路。该产品覆盖32卡至1024卡全系列,可扩展至万卡以上集群,在一个物理单元内完成算、网、存、能的协同。新华三首席技术官张弢表示:“单一能力的简单叠加无法实现系统最优。”

回顾全栈路线在IT行业的演进,其成功往往取决于一个关键前提:每个技术层都不能有明显的短板。对新华三而言,如何在六线并进的局面下保持各层的技术深度,是一个仍需交给时间验证的命题。

参数之外的答案

验证一个战略是否成立,不能只看发布会上的参数,还要看机房里的真实表现和客户的续约率。在这方面,新华三给出了多个维度的落地案例,但也不乏待解之问。

在上海,新华三与上海智能算力科技联合建设的万卡集群已投入实际运营。据辛帅透露,双方在技术路线上反复磨合,“2023年我们就和新华三的专家反复讨论,最终坚定选择了以太网,现在证明完全正确”。以太网的开放协议带来了供应链安全和系统灵活性的双重优势,使得运营方可以将“选择权始终留在自己手中”。

在杭州、郑州等十余个城市,新华三推动的“图灵小镇”模式已陆续落地。这一模式试图将算力和模型包装成像水电一样的公共设施,降低中小企业使用AI的门槛。据其公布的数据,目前已有数百家企业入驻。

但产业园区从“签约入驻”到“真正跑出商业模式”,还有漫长的距离。贵阳贵安图灵小镇的AI算力服务中心已建成,预计下半年才能投入使用。其运营方负责人赵文榛在峰会发言中提到,国企投资决策中“过度强调短期经济账”,缺乏对产业带动等长期价值的评估。反映出了“建算力”与“用算力”之间仍横亘着不小的落地阻力。而新华三的全栈路线能否在财务上真正跑通,关键指标也尚未完全浮出水面——其AI相关业务的毛利率、客户留存率,目前还不是公开数字。

在领航者峰会演讲的最后,于英涛将开场时的主题词从“亢奋与焦虑”替换成了“冷静与激情”。他说,缺了冷静的激情叫“冲动”,缺了激情的冷静是“平庸”。

于英涛在NAVIGAT 2026发表主题演讲

这番话既可以看作对全行业的告诫,也可以视为对新华三自身的提醒。他列出的两个“冰冷真相”值得思考:一是7万亿美元的全球AI基础设施账单不会自动转化为价值,押注不等于回报;二是Gartner预测的超40%智能体项目取消率,不是诅咒,而是提醒——“变革面前,道阻且长”。

对于新华三而言,2026年是一个关键节点。公司刚迈过成立十周年的门槛,年收入已达760亿元规模,但传统通信与IT硬件市场的天花板清晰可见。AI是其必须抓住的战略级机遇,而选择“全栈筑基”这条路径,意味着要同时承受多重考验:技术整合的复杂性、研发投入的持续性、以及市场对投资回报周期的耐心。

在这场关乎未来的AI马拉松中,新华三已选定了自己的配速与跑道。起跑阶段的声势已经足够响亮,但真正决定成败的,是三到五年后客户机房里持续运转的机器轰鸣声,以及那些今天尚在“试用算力”的企业最终选择留下的背影。


作者丨张琪玮 实习生王嘉琪编辑丨邱江勇美编丨马利亚监制丨赵晨

新华三

新华三

新华三集团作为数字化解决方案领导者,致力于成为客户业务创新、数字化转型值得信赖的合作伙伴。作为紫光集团旗下的核心企业,新华三拥有计算、存储、网络、5G、安全、终端等全方位的数字化基础设施整体能力,提供云计算、大数据、人工智能、工业互联网、信息安全、智能联接、边缘计算等在内的一站式数字化解决方案,以及端到端的技术服务。同时,新华三也是HPE®服务器、存储和技术服务的中国独家提供商。

新华三集团作为数字化解决方案领导者,致力于成为客户业务创新、数字化转型值得信赖的合作伙伴。作为紫光集团旗下的核心企业,新华三拥有计算、存储、网络、5G、安全、终端等全方位的数字化基础设施整体能力,提供云计算、大数据、人工智能、工业互联网、信息安全、智能联接、边缘计算等在内的一站式数字化解决方案,以及端到端的技术服务。同时,新华三也是HPE®服务器、存储和技术服务的中国独家提供商。收起

查看更多

相关推荐