作者:张学睿 商汤智能产业研究院助理研究员

 

日前,“信息化百人会第八届信息战略论坛”在京拉开帷幕。在本次论坛《东数西算工程推进中的难点问题与破解之道》“圆桌对话”环节,商汤智能产业研究院院长田丰根据“东数西算”各地区实际建设情况,提出了三个潜在挑战性问题。他表示,训练和推理数据跨省迁移难、通信网络成本高;计算核心节点的数据资产运营权属和数据商用合规性风险;以及一地一议、标准不统一的地方专项债/专项资金模式,都给民营科技企业投身“东数西算”产业浪潮中带来不确定性投入风险。

 

一开始要知道“东数西算”是什么?

 

“数”指数据,“算”是算力,算力指对数据的处理能力,类似于农业时代的水利、工业时代的电力,算力已成为数字经济发展的核心生产力。实施“东数西算”工程,就像“南水北调”“西电东输”一样,发挥我国体制机制优势,支持数据中心向资源充裕的西部转移,更多承接和保障东部数据处理需求。

 

图:《东数西算工程推进中的难点问题与破解之道》“圆桌对话”

 

谈及“东数西算”推进过程中面临的难题,田丰院长表示,东数西算归根结底是数字经济问题,数据是需求,算力是供给,供需匹配才能蓬勃发展。同时指出在东数西算中民营科技企业面临的三个挑战。

 

第一个挑战:用于训练和推理的数据跨省迁移难、迁移贵,偏高的通信网络价格应大幅降低。

 

网络是数字经济的供应链,网络成本决定数字经济活跃程度。实体经济中,海鲜是空运的,煤采用铁路和船运,其成本差距接近10倍,数据也一样。数据里面也有很多高精尖的、商业价值很高的数据,也有海量的、价值没有那么高、但也能够产生很大的产业规模优势的数据。所以,怎么去运?网络“运输”的成本能不能足够低?数字经济领域的“海运”、“船运”和“铁路”急待供给侧创新?这些问题很关键。

 

数字经济的供应链,即网络传输成本。“东数西算”,有价值的数据传输是需求,如果数据迁移成本很高会反过来压抑产业需求。

 

“东数西训”所针对的训练数据,是海量的数据:如果通过网络运输会非常贵;如果通过线下的硬盘转移方式,会面临很大的安全风险。这些都使得数据迁移不太好做。

 

“东数西推”所针对的推理数据,是没有办法跨过该省或者该区域的,并且可能涉及数据的权属、数据的保护。所以推理的数据中心内数据是很难去大量跨省迁移的,这都是实际中碰到的问题。

 

第一个挑战归结为数字经济生命线的交通成本,即网络的成本能不能进一步的降低。

 

“网络成本降低才能够真正达到数字经济指数级的上涨。数据很多,但数据运不出去还是没有用。”田丰院长称。

 

第二个挑战:计算核心节点的数据资产运营权属和数据商用合规性风险

 

第二个挑战与东数西算节点建设的模式有关系。我们在日常工作中去修一个高速公路,修高速公路之前就得谈好这10年的运营权归谁,怎么做商业闭环,建设数据中心也一样。

 

现在建设东数西算的数据中心的时候,民营企业参与到多少,民营企业的运营权益有没有受保护,数据资产的归属,应用的法律的合规性怎么处理,这些问题目前为止都是很模糊的。所以民营企业很担心的是,花了很大的力气、很多的投资建完数据中心,建完了以后公共的数据如何去挖掘?挖掘的过程中会不会又遇到很多合规性的一些风险?这是第二个挑战。

 

第三个挑战:一地一议、国内标准不统一的地方专项债/专项资金模式

 

第三个挑战与东数西算数据中心的投入有关。很多地区通过新基建的专项债、专项资金投入建设,但是每一个地区的政策都不一样、标准也不一样,甚至很多标准是没有的。地方一边做一边摸索,这诚然是一种创新,但企业现在是有很成熟的一套投资模式。从中央来讲,是不是有可能定义在东数西算的超算中心、数据中心上资金配套的统一的模式,或一种建议的模式?这样能够实现政府、国企还有民企都知道如何去做搭配型的投资,并且是一个全国可以复制的这种投资模式。

 

以上是民营科技企业投身“东数西算”产业浪潮中三个不确定性投入风险。

 

圆桌对话中,田丰院长还被问及:商汤为什么要斥巨资建设这样一个智算中心?它的商业模式到底是怎样的?对于商汤来说,“东数西算”带来了什么样的发展机遇和挑战?

 

就此,田丰院长首先提到上海最近刚发布的《上海市培育“元宇宙”新赛道行动方案(2022-2025年)》,指出元宇宙是一个巨大的算力的需求,其对算力的要求至少提升3个数量级。其次,上海的新能源车非常火,不止是特斯拉向全球出口,还有很多品牌的国产新能源车,智能车的算力需求也很大。

 

田丰院长称,基建一定先行,所以上海政府的支持下,商汤提前两三年就开始建设AIDC(指“人工智能计算中心”或称“商汤智算中心”)。用三个数字来对比可以看出商汤AIDC的实力。

 

第一个数字:1800

特斯拉自研的超算中心(超级计算机Dojo)算力是1800 Petaflops(1.8EFLOPS) 。

 

第二个数字:1895

Meta(原Facebook)建造的超级计算机RSC可提供1895(千万亿次)TF32计算性能。

 

第三个数字:3740

商汤2022年刚刚建成亚洲最大的人工智能计算中心AIDC,峰值算力高达3740 Petaflops(1 Petaflop等于每秒1千万亿次浮点运算)。

 

可以看到中国在算力方面已经遥遥领先。截至2021年底,商汤23个投入使用的超算集群总算力为每秒1170千万亿次浮点计算,而新建的新一代人工智能计算中心也已于2022年1月在上海临港正式落成启用,设计峰值算力可达3740千万亿次浮点计算,算力总计达到4910Petaflops,这个是商汤AIDC为什么有底气说“亚洲最大”。商汤AIDC得益于长三角地区的智能车、元宇宙,以及AI科研产业数字化转型、智能制造强大的算力需求。

 

图:信息化百人会第八届信息战略论坛

 

此外,田丰院长还提出商汤AIDC具备三个特点。

 

第一个特点:AI软件定义硬件。

 

任何一代的算力革命都是由需求和数据牵引的,商汤科技有自己的智慧城市、智慧商业,包括数字世界和智能车这样的一些业务,所以更靠近应用层,用软件来去定义这个硬件的数据中心会更好地贴近产业的需求。

 

第二个特点:运营定义建设。

 

一条路不是修好了就一定有车跑的,一个工厂也不是建好了就一定有生意的,所以商汤科技在所有地区的AI超算中心是负责运营的,从运营、市场商业闭环的角度,去定义区域的数据中心、AI超算中心应该怎么去建。

 

第三个特点:用国产化定义中国下一代的算力基础设施。

 

商汤科技牵头成立“人工智能算力产业生态联盟”(简称:智算联盟),联手国产芯片厂商,与清华大学、复旦大学、上海交通大学、中国信息通信研究院、中国电子技术标准化研究院及行业伙伴共同推动国产算力落地。

 

田丰院长称,以上三个特点是商汤科技努力做全球AI算力领先的枢纽的初心。