众所周知,中国是全球 GDP 排名第二的经济大国。不过,很多人可能不知道的是:占中国 GDP 23% 的,是材料产业,2018 年新材料产值 3.9 万亿元,中国目前已形成了全球门类最全、品种与产量规模第一的材料产业体系。但在新材料方面,创新能力不足、创新质量不高、迭代经验欠缺的问题仍然十分突出。[1]

 

 

为了解决这些问题,中国于 2016 年正式启动“材料基因组工程”,旨在以人工智能、机器学习为根本途径,结合数据库平台,对材料进行高通量计算、制备、检测,颠覆传统材料研发方式,加速材料领域的发展。[2]

 

中科院物理所是材料基因工程的重要研究基地,最近,该所与英特尔和戴尔携手,借助数据增强型超算技术,使用软硬结合的计算、存储、网络方案,开发出面向未来研究需求的新一期材料基因计算和数据处理平台,可以提升新材料研究与成果共享的效率。

 

此高通量计算,非彼高性能计算

长期以来,传统的新材料研发,多采取“试错式”,导致材料研发周期长、费用高。材料基因工程,是指借助于大数据和 AI 技术,加快寻找材料“基因”——即原子和分子的排列——与性能之间的关系。其中,高通量计算系统最为关键,这是可以并行处理大量独立工作任务的计算系统,非常适用于需要大量筛选样品的场景,比如生物、医药的研发过程,当然包括材料基因的模拟计算和筛选,这也是中科院物理所建立新平台的重中之重。

 

与传统的高性能计算系统相比,高通量计算有如下四个突出特点:

 

■  工作特性:

通常采用线程级并行处理,工作负载根据任务请求不断变化;

■  执行效率:

更强调计算与数据的集成,数据存储读写性能直接影响系统效率;

■  性能目标:

更注重提升单位时间内,并发的计算与数据处理需求数量;

■  成本要求:

系统处理能力与线程数量正相关,单线程成本优先可提升整体处理能力。

 

材料基因计算的工作流程

 

有鉴于此,针对新材料基因计算平台,中科院物理所提出以下三点要求:

 

技术先进:

新平台的计算与存储硬件架构要能支撑未来数年内持续增长的高通量材料基因计算任务,并保持性能优势;

 

工作稳定:

新平台要肩负起海量的高通量材料基因计算任务,为避免难以预计的损失,架构的可靠和稳定是首要任务;

 

运维便捷:

中科院物理所人力资源紧张,没有余力为平台配备专职运维专家,需要平台的运维上手便捷。

 

戴尔和英特尔的解决方案可以雀屏中选,正是因为满足了上述要求。

 

三方协作,领跑世界

高通量计算的算力主要来自处理器。新平台采用的英特尔®至强®金牌 6230R 处理器,在核心数、线程数和缓存上,都提升了 30%。此外,还有英特尔®至强®铂金 9242 处理器满足特定场景的算力需求,这些处理器配置在戴尔易安信 PowerEdge 服务器中,从算力上满足了中科院物理所对于新平台的第一点需要:技术先进。

 

 

英特尔®至强®金牌 6320R 处理器(2020 年)与英特尔®至强®金牌 6230 处理器(2019 年)在主要产品规格上的对比

 

接下来,英特尔与戴尔一起,将戴尔易安信 PowerVault ME4 系列存储、戴尔易安信 Isilon 系列可扩展 NAS 存储、戴尔易安信 VxRail 超融合架构以及英特尔® OPA 等先进软硬件产品与技术引入新平台。

 

中科院物理所新一期高通量材料计算和数据处理平台主要硬件架构

 

材料基因计算的结果是大量非结构化数据。新平台中用到的一系列戴尔 NAS 存储产品,以出色的效率和卓越的可扩展性著称。4 台 H400 Isilon 混合横向扩展 NAS 机和 8 台 A2000 Isilon 归档横向扩展 NAS 机构成统一的分级存储资源池,分别承载数据分析和数据安全存储的重任。二者出色的横向扩展特性,帮助平台弹性地扩展存储容量。内置的 OneFS 操作系统提供高达 80% 的存储利用率,并具备多种数据保护和安全性措施,确保平台数据安全可靠,这就满足了中科院物理所对新平台对于稳定、可靠的需求。

 

戴尔易安信 VxRail 超融合一体机用于构建云资源池,可共享材料基因计算的数据结果、代码和计算工具。VxRail 超融合架构可以集成戴尔 SDDC(Software Defined Data Center,软件定义数据中心)软件体系,然后部署 VMware Cloud Foundation 云环境,从而大大简化了云平台的规划、搭建和部署,后续运维复杂度也大幅降低,可以做到“一键上云”,运维更便捷。

 

此外,英特尔® OPA 以链路层的技术革新,保护了网络中数据包的完整,同时网络延迟更低。它的扩展性能满足中科院物理所新平台未来升级的需求。

 

随着新平台全部节点全部投入使用,只需一年即可完成目前人类已知的所有无机晶体材料(约 10 万个)的计算。此后三到五年,中科院物理所将会继续扩展平台计算节点数量,翻番算力,将 50 万个未知材料的数据纳入数据库中。

 

 

“中国材料基因工程领域研究进展形势喜人,有望在 2025 年进入世界并跑或领跑行列。”[3]在中科院物理所、戴尔和英特尔的三方协作下,预测正在逐步变为现实。

 

参考文章:

[1] 材料基因工程引领我国材料科技创新

 

http://news.sciencenet.cn/htmlnews/2019/11/433104.shtm

 

[2] 将 AI 应用到新材料 斩断卡脖子的那根“绳索”

 

https://finance.sina.com.cn/chanjing/cyxw/2020-09-11/doc-iivhuipp3823471.shtml

 

[3] 我国材料基因工程 2025 年或领跑世界

 

http://news.sciencenet.cn/htmlnews/2018/10/418792.shtm