不久前,中国移动在中国算力大会透露,正在构建亚洲最大的单体智算中心,算力规模5EFLOPS,万片级AI加速芯片。
怎么理解中国移动这个布局呢?
我认为这是中国移动在有意识地调整自身的算力布局,以更好地适应算力产业的发展。
过去,中国移动常被诟病专注于简单的通用算力建设,造成大量的资源浪费,比如在此前的行业雄文《中国算力,雄心与软肋》中就写道,“电信运营商资本支出高,扩大算力投入意愿强。但目前大部分投入都集中于通用算力。由于研发支出低,缺少技术积淀,智算资源也不足。电信运营商面对智能算力浪潮时,反应迟缓。”,并暗指电信运营商主导的通用算力竞赛,比的是简单的资源投入,正在成为中国算力的软肋。
客观来说,这种诟病和批评有一定的道理,中国移动在中国数字社会建设中的地位自视颇高,要当领军者,但过去两三年其在创新突破、技术引领等方面的表现是配不上其自视的地位的。
事实上,中国移动也很清楚这一点,在中国算力大会上中国移动就谈到当前算网基础设施发展呈现的“三个转变”——
一是资源分布从不均衡“集聚”向高水平“集群”转变,逐步形成热点集约、跨区辐射、边缘覆盖的基础设施体系。
二是功能性能从“通算为主”向“通算、智算、超算、量子计算集成”转变,支撑多样化、个性化、极致化计算需求。
三是供给模式从“算、网分立”向“算网共生”转变,推动基础设施综合集成、一体服务。
构建亚洲最大的单体智算中心,正是中国移动适应这种转变的一个主动作为。
我认为,构建亚洲最大的单体智算中心,中国移动有三重考虑:
第一,弥补自身智能算力不足。
根据半年报的数据,截至6月底,中国移动对外可用IDC机架达到47.8万架,累计投产算力服务器超80.4万台,算力规模达到9.4EFlops,这其中应该绝大部分是通用算力。而当前大模型算法推动人工智能向更通用方向发展,带动智能算力需求激增,中国移动当前主要是通过算力并网的方式,纳入社会上的智能算力,以此满足市场对智能算力的需求,但从自身发展的角度,中国移动必须在短时间内补充自身的智算资源,以应对市场的竞争。
第二,以此为突破点,加快自身科技进步。
智算中心的建设和运营技术难度很高,一方面,智算中心需要提供高可用性、高扩展性和高效率的计算服务,就需要采用高效的计算架构和算法,提高计算性能与计算速度并降低能耗。同时,还需要考虑如何优化计算资源的分配和管理,以满足不同应用场景的需求。另一方面,智算中心对网络的要求特别高,需要构建一个高效、可靠、快速响应的网络架构,以满足大规模数据传输和交互的需求。同时,还需要考虑网络延迟、数据安全和隐私保护等问题。
此外,对智算中心的各类资源如何计算管理、分配与调度,也是需要重点解决的问题。需要有高效的管理系统来充分提高智算中心的资源使用率。中国移动构建亚洲最大的单体智算中心,这其实是一次非常重要的练兵,以此来磨练自身在智能算力建设上的能力,以及对各类资源的统筹整合能力,对于后续的发展非常重要。
第三,打磨能力,树立智算品牌。
打造亚洲最大的单体智算中心,这既是一种磨练,也是一种能力的展现,对于树立自身的品牌很有助力。
前几天,《京能国际北京人工智能公共算力平台建设项目》发布了中标候选人公示,阿里云以 9.16 亿拿下该项目。而当我去翻查该项目的具体信息时,发现北京人工智能公共算力平台是由北京电信主要承建的。
而这就是问题所在,中国电信正在力推天翼云,天翼云号称全球最大的运营商云、国内最大的混合云、国内营收规模即将最大的公有云,但在其承建的算力平台项目中,却要拿出巨资来“请外援”完成智能算力部分的建设,究其根本,还是自身在智算能力上的积累不足,对天翼云的品牌是一种削弱。当然,这是我猜的。
打造亚洲最大的单体智算中心,对于中国移动算力品牌,将是一次巨大的增益。
1413
下载ECAD模型