日前,华为发布了 ARM 服务器芯片鲲鹏 920,以及搭载鲲鹏 920 的 ARM 服务器。总的来说,这款芯片的设计思路和高通 / 华芯通、飞腾等 ARM 阵营 IC 设计公司是类似的,那就是“单核性能不够,核心数来凑”,依靠比 Intel CPU 更多的核心数量获得强悍的多核性能。从华为公布的数据来看,多核性能强悍,但由于单核性能和 Intel 有一定差距,以及 ARM 在生态上的差距和芯片成本问题,单靠纯粹商业化运作,不依赖政府和国企的帮助,前途是比较一般的。另外,一些媒体鼓吹的说辞也存在值得商榷的地方。

鲲鹏 920 Base on A76?
根据华为官方消息:

鲲鹏 920 是目前业界最高性能 ARM-based 处理器。该处理器采用 7nm 制造工艺,基于 ARM 架构授权,由华为公司自主设计完成。鲲鹏 920 主频可达 2.6GHz,单芯片可支持 64 核。该芯片集成 8 通道 DDR4,内存带宽超出业界主流 46%。芯片集成 100G RoCE 以太网卡功能,大幅提高系统集成度。鲲鹏 920 支持 PCIe4.0 及 CCIX 接口,可提供 640Gbps 总带宽,单槽位接口速率为业界主流速率的两倍,有效提升存储及各类加速器的性能。典型主频下,SPECint Benchmark 评分超过 930,超出业界标杆 25%。同时,能效比优于业界标杆 30%。鲲鹏 920 以更低功耗为数据中心提供更强性能。

由于飞腾的 FT2000 和鲲鹏 920 同属 ARM 阵营,且都是 64 核芯片,那么,就对比一下两者的 SPEC06 测试成绩。

 


先要说明的是,FT2000 是飞腾在 2016 年的芯片,工艺为 28nm,相对于 2018-2019 问世,采用 7nm 工艺的鲲鹏 920 在制造工艺和时间上先天处于劣势。这里仅拿飞腾做一个参照。

 


根据业内人士告知,FT2000 在 2G 主频,编译器为 GCC4.8 的情况下,SPEC2006 测试单核成绩为定点 12.4,浮点 11.3,多核成绩为定点 570,浮点 482,这个成绩与 Intel Xeon E5-2695v3 相当。

由于不清楚鲲鹏 920 的具体测试条件,就假定于 FT2000 相当好了。

鲲鹏 920 的定点成绩为 930,相对于 FT2000 的 570 提升了约 60%,这既展示出华为的实力,也是两年时间技术进步的体现。

由于鲲鹏 920 与 FT2000 都是 64 核,假定华为的多核扩展做的和飞腾差不多,那么鲲鹏 920 的单核成绩应当在 20 分左右。由于鲲鹏 920 的主频为 2.6G,换算一下就是接近 8/G,内核性能大致与 ARM Cortex A76 相当,或略强于 ARM Cortex A76,与 AMD 的 Zen,Intel 的 skylake 还是有不小的差距。

这与此前一位海思大佬宣称的这个 10.8/G 有不小差距。除非华为在多核扩展方面做的比较差,与飞腾存在较大差距,导致性能损耗太大,否则就很难自圆其说了。就这个角度看,虽然华为自称是自主完成设计,但以目前公开的游戏信息,恐怕很难打消外界鲲鹏 920 是 Base on A76 的猜测。

另外,业内人士表示:

    技术只能迭代演进,如果不是耗费十多年时间从零开始技术积累,每一代 CPU 的进步,代码替换量不会超过 25%,因而,像 Intel、ARM 这么牛逼,CPU 也是迭代演进的,不存在一步登天的情况。

    如果一款号称“自主研发”的 CPU 一问世就一步登天,性能牛逼、可靠性、稳定性、兼容性好,软件生态完善,那这款 CPU 的自主性就要打一个问号了。


还有业内人士表示:

    即便是技术引进消化吸收,也是需要站在巨人肩膀上的,必然保留大量“巨人”的源代码。

从实践上看以苹果来说,在收购了 PA 这样的 IC 设计公司后,又高薪挖了很多大牛,也是拿 Cortex A8、A9、A15 改了三代,也就是 A4、A5、A6 处理器,至于在“幽灵”和“熔断”爆发的时候,ARM 宣布,因为 Cortex A8、A9、A15 存在漏洞,所以苹果的数款 CPU 也存在漏洞……之后设计 CPU 也存在“高度借鉴”前人设计的情况,美国法院就判决,苹果的处理器侵权,并命令苹果公司支付 5.06 亿美元赔偿。

此外,华为虽然开发过 Hi1610、Hi1612、HI1616,看起来是演进了四代 CPU,但实际上,Hi1610、Hi1612 是买 A57 做集成,HI1616 是 A72 做集成,华为做的只是 SoC 的设计,内核迭代完全依赖从 ARM 买新一代内核。

因此,在此前并没有独立开发过 CPU 核的情况下,突然冒出一个 Zen 级别的内核(海思大佬的说法),或 A76 级别的内核(根据华为公开数据对照 FT2000 推算),而且全部源码 100%自己写,就有违技术发展规律了。

有鉴于如今凡是做 CPU 的,无论是买 IP 做集成也好,还是拿洋芯片穿马甲也罢,都自我标榜自主研发,自主知识产权,以及华为曾经把买 A57 做集成宣传为“完整自主知识产权”,并将 A57、A72 作为自主可控产品打入中央机关政府采购名录,对于华为官方的宣传自主研发,大家别急着给华为背书,还是留给时间来检验。
 

 

 


媒体报道应实事求是
在鲲鹏 920 亮相后,媒体赞美之词不绝于耳,不过,一些报道是值得商榷的。

有文章声称,鲲鹏 920 把计算带入多核异构的多样性时代。但是异构计算早就不是什么新鲜事物,在超算上,特别是 TOP500 排名靠前的超算上,大多都是异构计算,即便是服务器 CPU,Intel 在收购阿尔特拉之后,也拿出了 CPU+FPGA 的异构计算产品。相比之下,华为鲲鹏 920 只是一款 ARM 服务器 CPU,没有实现片上异构。

铁流猜测,文宣声称鲲鹏 920 把计算带入多核异构的多样性时代,估计想表示鲲鹏 920 的一些接口能够支持 CPU+GPU,CPU+NPU,只不过文宣想表达的鸡血一点,然后宣传过头了。

还有鼓吹鲲鹏 920 性能的,但是标杆的选择有些问题,原文是:

    典型主频下,SPECint Benchmark 评分超过 930,超出业界标杆 25%。同时,能效比优于业界标杆 30%,此前的纪录保持者是富士通的 7 纳米 A64X,每个芯片最高可达每秒 2.7 万亿次浮点运算(2.7 teraflops)。

首先,SPEC 测试和浮点运算次数根本不是一回事。科学运算看重双精浮点性能,而对 PC 和服务器而言,SPEC 测试更具借鉴意义。像一些专门针对科学运算的 CPU,会出现浮点运算性能牛逼,但 SPEC 测试成绩很一般的情况,最典型的例子就是龙芯 3B1500。

其次,是对比的参数有问题,文章在把富士通的 ARM 芯片(应当是 A64FX,不是文宣写的 A64X)做对比时,举的例子是富士通 ARM 芯片的浮点性能,而拿鲲鹏 920 的数据用的是定点性能,然后把富士通 ARM 芯片的浮点性能作为鲲鹏 920 定点性能的标杆 ......

最后,富士通的那款 ARM 芯片和鲲鹏 920 应用场景完全不同。富士通那款 ARM 芯片是超算芯片,计划应用于日本的 E 级超算,设计思路是类似 SW26010 的片上异构的众核方案。而华为的鲲鹏 920 就是服务器 CPU,两款芯片根本不是一路货,根本谈不上谁是谁的标杆。

另外,还有把鲲鹏 920 与 5G,以及万物感知、万物互联、万物智能等概念进行关联的修辞方式也值得商榷。诚然,5G 正当风口,万物感知、万物互联、万物智能看起来高大上,绑在一起可以大幅增加“逼格”。

 


只不过,5G 其实是商业概念,根本不是技术迭代,全球通信厂商把一大堆零增益、负增益的技术塞进 5G 标准,整个系统效率基本没有提升,完全靠建设 5 倍的基站和消耗 20 倍的带宽提升网速,而且蓝图里的 URLLC 场景现在的 5G 技术根本实现不了,mMTC 场景 2G、4G 都能做,现在最大的物联网应用就是删减版的 4G,恰恰是华为和电信搞出来的。前不久运营商采购物联网芯片,用的也是 2G。因此,5G 和万物互联进行捆绑完全是谎言。

另外,万物感知相关联的是传感器,万物智能相关的是 AI 芯片,万物互联关联的是各类通信芯片,铁流实在看不出来,介绍一款服务器 CPU 为何一定要把万物感知、万物互联、万物智能绑在一起的。

 


ARM 服务器商业前景不佳
前些年,ARM 宣布进军服务器 CPU,高通、AMD、博通、凯为、华为、飞腾等一大批国内外厂商跟随,炒作的热度比起现在被热炒的 RISC-V 有过之无不及。

然而,ARM 服务器 CPU 没有像当年预估的那样大红大紫,反而在商业市场折戟沉沙。AMD、Marvell 已经相继退出,高通 QDT 大裁员,甚至连 QDT 技术副总裁、高通 Falkor ARM 服务器架构设计的灵魂人物 Bhandarkar 都离职了。高通 ARM 服务器项目的最大支持者,高通创始人之子保罗·雅各布也被赶出公司。

 


在这种情况下,有业内人士依旧看好 ARM 服务器,理由如下:

业界有一种说法,即只要拥有 20%的成本优势,就有动力更换处理器架构。各大牛企都在看 ARM 服务器,因为 Intel 垄断太厉害,大家都希望找一个取代 Intel 的 CPU。

然而,很多企业想把 Intel 换掉,是因为 Intel 垄断价格太贵,结果服务器厂商、互联网厂商的很多利润变相被 Intel 拿走了。因此,把 Intel CPU 换掉的前提是,新的 CPU 必须物美价廉,这样才能省钱,各大牛企才有动力去换。

现在的情况是,ARM 服务器 CPU 性能不如 X86,特别是单核性能明显不如 X86,在生态上被 X86 秒杀,在价格上更贵——由于目前的 ARM 服务器 CPU 走的都是“单核性能不够,堆核心数来凑”的路线,往往用 48 核、64 核去战 Intel 24 核、28 核,存在芯片面积偏大的问题,加上比较有限的产量,成本会非常高。

因此,由于在性能、生态和价格上 ARM 服务器 CPU 对比 X86 CPU 都处于劣势,因而互联网巨头只会买一些测一测、试一试,不会现在就海量采购大规模部署替换 X86 的情况。这也是高通、AMD 等巨头先后抛弃 ARM 服务器 CPU 业务的原因所在。

至于 BAT 这些公司“自带干粮”去做移植软件,这也未免一厢情愿。国内 ARM 阵营厂商不是 BAT 的股东,BAT 也不是国内 ARM 阵营厂商的股东。BAT 是非常商业化的公司,BAT 只是对投资人和股价负责,而不是对国内 ARM 阵营厂商负责。

 

 

BAT 几万名软件工程师放下手头的工作,去给国内 ARM 阵营厂商移植软件,工资谁出?国内 ARM 阵营厂商给钱?还是 BAT 给自己的员工发工资?

几万名软件工程师放下手头的工作去移植软件,耽误掉的工作怎么办?带来的经济损失,国内 ARM 阵营厂商会补贴么?

BAT 牺牲自己的利益去成全国内 ARM 阵营厂商,BAT 脑子进水了么?

何况个别国内 ARM 阵营厂商已经是国内 ICT 行业很多企业的竞争对手,敌人多于朋友,和 BAT 已经在一些领域中存在竞争了。比如在云计算上,就华为和阿里抢政府订单打的头破血流,阿里还为此还向相关部门投诉华为不正当竞争。

在发布会上,阿里高管直接给华为云、腾讯云安上“拿来主义的云”标签,以显示阿里飞天云“自主可控”,高华为云一等,彼此间的暗战和矛盾显而易见。

在这种情况下,要让阿里做出巨大牺牲去扶持自己竞争对手的 ARM 服务器的可能性并不高,特别是阿里麾下的中天微已经押宝 RISC-V,扶持中天微完善 RISC-V 的生态显然比扶持竞争对手更符合阿里的商业利益。

5 年后会怎样,铁流不敢说,至少在当下,一些媒体无限吹捧 ARM 服务器 CPU 的商业前景是非常不客观的。

从市场反应来看,真正冲击 Intel 的并非是各路 ARM,还是同属 X86 阵营的 AMD,原因就在于之前提到的三个因素:性能、价格、生态,AMD 达到了门槛,而华为等 ARM 阵营厂商还远未能及格。
 

 


华为 ARM 服务器可能会走 IBM 大机器的商业模式

关于高通 ARM 服务器业务大裁员,有网友表示,高通直接卖芯片,华为既做整机,又卖芯片,可以像麒麟芯片和手机业务那样起到相辅相成的作用,所以高通会失败,华为能成功。

不知道是不是高通手机芯片业务直接卖芯片让人先入为主了,其实,高通的 ARM 服务器业务并非像 Intel、AMD 那样直接卖散片,也是定做主板后整机出售这种模式。

 


另外,麒麟芯片能够起来的关键是安卓有完善的生态,而且可以从 ARM 那里买到非常具有市场竞争力的 CPU 和 GPU。但在 ARM 服务器方面,ARM 自己的 IP 相对于 Intel 不具备竞争力,在生态上也被 X86 秒杀,ARM 的生态只局限于嵌入式、智能手机,华为要推 ARM 服务器,就要自建生态,难度远非在做手机芯片可比。

而且即便做成了,也存在一个悖论,那就是既然自建生态,那么为何不做中国版 Wintel,反而给 ARM 打工,为 ARM 做嫁衣?

何况,现阶段的 ARM 服务器 CPU 本身就是缺乏市场竞争力的,正是因此,在政府采购名录中,可以看到各种 ARM 服务器的身影,华为在将买 A57 做集成和买 A72 做集成的芯片打入政府采购名录后,鲲鹏 920 有可能也将进入政府采购名录。

从实践上看,RISC 服务器中的 Alpha、SPARC、PA-RISC 等基本消亡了,如今还有声响的就是 IBM 的服务器,而 IBM 的大机器是高度依赖美国政府等对价格极度不敏感的客户订单来维系的。在商业市场上,面对廉价的 X86 服务器,IBM 的机器缺乏竞争力。面对困境当年郭士纳的改革就是“砍砍砍、卖卖卖”,裁员、砍研发、砍机构,卖业务、卖技术、卖大楼,如果不是价格太贵,没有客户愿意买,差点就抢在索尼和 AMD 之前实现了超级企业卖大楼。在砍掉很多业务后,郭士纳选择了购买 X86 芯片做服务器,也是就是后来联想从 IBM 买来的业务。

可以说,历史已经证明了 X86 的横向整合模式在成本上相对于 IBM、SUN、惠普、SGI、DEC 的垂直整合模式具有天然的成本优势,华为如今的做法无非是重走一次 IBM、SUN、惠普、SGI、DEC 走过的大坑,顺带把自己的资金和国家资源拉过来填坑。

时至今日,IBM 的 Power 越来越被边缘化。正是因此,IBM 搞了 OpenPower,但还是无法逆袭。可以说,华为的 ARM 服务器 CPU 未来几年的商业模式会和 IBM 的大机器类似,高度依赖政府、国企等受政策指令因素影响极大,且对价格不敏感的客户的订单。

ARM 会扼杀中国版 Wintel 的成长
铁流以前的文章中说过,党政国企市场是中国版 WIntel 的孵化池,最好是 SW+自主内核的操作系统。由于现实中不存在自主内核的操作系统,那么只能退而求其次,以 SW+BSD/Linux 构间中国版 Wintel。

而一旦 ARM 大肆入侵,获得国家资源倾斜,那么就会挤压中国版 Wintel 的生产空间。何况,ARM 的安全风险不容小觑。

 


在 2015 年,集成电路大基金注资中兴微电子 24 亿人民币,中兴也喊出了“中兴讯龙芯+中兴 OS”的口号,CPU 上选择加入 ARM 阵营,中兴 OS 则选择和谷歌合作开发。之后开发了好几款集成了 A53 和 A72 的机顶盒芯片。

结果在 2016 年和 2018 年两次制裁中,由于 ARM 加入制裁,台积电拒绝给中兴的 ARM 芯片代工,然后中兴把订单给境内晶圆厂,但境内晶圆厂也不敢接单,据中兴员工披露:当被中芯国际拒单时,才意识的问题的严重性。中兴微电子的 ARM 芯片随即休克。

前不久,日本软银封杀了华为的通信设备,由于日资企业唯美国政府马首是瞻,当华为的 ARM 服务器业务做到通信设备的市场地位之际,没准软银又来一个封杀。

何况现在直接就上服务器芯片,本身就存在问题。

业内人士表示:

    国内芯片的商用发展应该是先做各种嵌入式芯、类手机等量大面广的芯片,然后是类树莓派等开发板芯片,然后是桌面,最后是服务器芯片。现在一大堆公司,仗着国家政策和核高基补贴,直接就上服务器 CPU,力图在这个领域和 Intel 在商业市场竞争,错的太离谱了,实属不智。

铁流认为,当下发展国产 CPU,就两条路,一条是纯自主路线,就是自主指令集,自主 CPU,自建生态之路,典型的代表是 SW。另一条是纯粹技术引进路线,引进国外最顶尖技术,有完善生态,产品可以直接造血的路线,这条路线就像合资车厂,虽然对自主可控毫无意义,但至少能造血,是现金奶牛。

而像 ARM 这种折中路线,在实践中会非常尴尬,就自主性而言,不能和 SW 比,而且始终存在安全风险,当年的“一芯一系统”变成“三芯多系统”就折射出相关部门对 ARM 的深切忧虑和不安。就商业市场而言,ARM 路线又不具备造血能力,如果没有国家兜底,纯商业市场必然悲剧,高通就是前车之鉴。因此必须要政策、要扶持,要国家资源倾斜,而这时候又会有一个悖论,那就是与其用国家资源扶持 ARM,为何不去扶持 SW?

这里再说明一下铁流为何对 ARM 服务器不看好:

1、ARM 服务器不像 ARM 手机芯片有完善生态,需要自己耗费巨资开荒,前期铁定赔钱,即便做成了也是为 ARM 做嫁衣。就自建生态而言,为何不给 SW 建生态?

2、由于国内 ARM 服务器 CPU 公司由很强的政商关系,可以拿核高基 01 专项,各种国家政策扶持和国企采购,这样一来,等于是动用国家资源补贴 ARM 和软银建生态。

3、ARM 具有很强的欺骗性。相对于 X86 这种明眼人一看就知道不可能自主可控的芯片,ARM 被广泛包装和鼓吹为实现自主可控的有效途径,而且已经打入政府采购,获得越来也多的国家资源扶持,加上一些企业舆论引导很强,曝光率很高,ARM 已经被包装为自主可控的希望之光。一位业内人士就表示:华为造势,XX 立项,咱们跟上,分肉吃。相比之下,X86 几乎是过街老鼠,不具备欺骗性。铁流不希望国家资源被一些厂商动用政商关系绑架,在 ARM 的歧路上一路狂奔。

4、按照现在的态势,加上软银成立合资公司试图在股市割韭菜并包装为技术转让,ARM 有可能成为事实上的国家指令集,中国版 Wintel 可能会被 ARM 这个特洛伊木马扼杀于萌芽状态。而且 ARM 既不安全,也不可控,中兴前车之鉴历历在目,勿使后人复哀后人也。