一个疑问
为什么许多地方zf正在陷入“现有的算力不够用,新建的算力用不了”的焦虑呢?
类似的问题是:新建的智算中心使用率过低;大多数高性能计算软件跑不了,计算精度不满足软件要求等等外界质疑。虽然,有些问题是大众把“超算”和“智算”的概念搞混淆了,也有些是把科研、技术研发和行业应用搞混了。但,谁叫你们都叫“算力”呢?
两则新闻
2021年,NVIDIA宣布正式启动英国最强超级计算机“Cambridge-1"(剑桥一号),主要用于英国的医疗健康研究。
CAMBRIDGE-1 拉开帷幕:大力支持医疗健康和生命科学研究。Cambridge-1 正在加速医疗影像、基因组学和药物研发领域的健康研究。Cambridge-1 携手 AstraZeneca、GSK、Guy's and St Thomas' NHS Foundation Trust、伦敦国王学院和 Oxford Nanopore 等合作伙伴以及其他英国企业组织,致力于通过数字生物学推动英国健康研究的发展,进一步深入研究疾病,并寻求医学突破。
2020年,Siemens 与 NVIDIA 合作开始着手实现实时数字孪生,将让各种规模的企业把工业虚拟世界变成现实。
Siemens 和 NVIDIA 正在携手合作,连接 Siemens Xcelerator 和 NVIDIA Omniverse™ 平台,从而将工业自动化提升至更高水平。此合作伙伴关系会将 Siemens Xcelerator 庞大的工业生态系统与 NVIDIA Omniverse 支持 AI 的物理级准确的实时虚拟世界引擎相结合,从而实现全设计保真的实时数字孪生,将软件定义的 AI 系统从边缘连接到云。
实际上,高性能计算机制造商联合行业巨头去规划超级计算机的案例实际上还有许多。早在2013年,英国BP就建造了3.8pflops的高性能计算机中心,用于石油勘探;2018年,意大利埃尼石油公司在米兰的超级运算中心安装了新设备,使之运算能力翻了两番,成为全球最强大的工业计算机。
三个启示
在我国,推动政府规划和实施算力建设的基本是计算机硬件厂商(如华为,曙光等),政府也是以“要想富先修路”的朴素思考,所以算力先批先建。以对未来数字经济发展的重要性而言,确实可以将算力和电力类比。但二者的规划和建设思路的差异巨大。
我们的传统领域巨头因为缺乏科研基础,提不出算力需求来。简单而言,我国目前没有Siemens(市值690亿美金)、AstraZeneca(全球6万员工)这样企业;新的科技创新企业也远不够强大,自己投不起算力建设,也影响不了政府的算力建设规划。所以,当前应该加大力度去调研、联合和帮助潜在对算力需求巨大的行业,只有需求起来,算力商业化才可能正常实现。
在技术层面,各种国产计算硬件架构无法在(通过)基础软件层实现兼容,各家都有一个不同的软件支持列表,有更多软件直接无法运行。也有另外一种声音是“是时候出台标准规范了”。我认为,以上两种方式都无法在短期内解决最前面的问题,并且这不是问题的根源。异构计算时代,算力将必然是多样化的。面向场景,实现软硬件融合的算力基建是最快路径。(但谁应该为软硬件融合的研发成本买单呢?有人躲躲闪闪,有人焦虑。)
结尾的故事
美国品客薯片公司的技术人员就曾多次来到国际超算会议上作报告,大谈特谈“薯片空气动力学”。
我不喜欢吃薯片,喜欢吃周村烧饼。这无关空气动力学,只是薯片的味道太重了。
TOP50的超算设备中仅有1台来自中国的商用系统。虽然超算已非阳春白雪,但中国的大型超算设备仍主要用于科学计算,尚需时间来大规模向商业辐射。
欢迎留言交流,感谢!
360
下载ECAD模型