加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • AlphaFold2预测蛋白质折叠结构的启发
    • AI能给芯片行业带来什么?
    • 鹏城实验室的AI for IC布局
    • 结语
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

中国工程院院士高文:AI能给芯片行业带来什么?

2021/11/17
1087
阅读需 10 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

| 高文演讲实录

11月13日,由张江高科、全球领先的半导体产业智库芯谋研究与上海集成电路产业集群发展促进机构联合举办的,“张江高科·芯谋研究(第七届)集成电路产业领袖峰会”在上海浦东召开。

中国工程院院士、鹏城实验室主任 高文在峰会上,中国工程院院士、鹏城实验室主任高文院士带来了主题为《AI for IC @鹏城》的精彩演讲。高文院士是国内计算机领域知名专家,不久前刚获得“2020年度国家技术发明奖一等奖”。在演讲中,高文院士从人工智能程序成功预测蛋白质折叠结构的启示,谈到人工智能AI与集成电路IC的融合发展路线。芯谋研究整理了高文院士演讲的精彩内容,以馈读者。

AlphaFold2预测蛋白质折叠结构的启发

几个月前,人工智能程序AlphaFold2再次引爆科研圈,它成功地预测出98.5%的人类蛋白质折叠结构。我们知道,蛋白质由多肽链连接,连接的数量非常庞大,结构也异常复杂。目前在整个通用蛋白质数据库里面有超过22亿个蛋白质数据,约17万个蛋白质序列拥有3D结构,问题规模庞大。

以往判断一个蛋白质的性能,要依赖非常有经验的生物学家给出结构预测,再由几位生物学家综合打分,来判定预测的合理性。这种思路为人工智能预测蛋白质折叠结构提供了思路。人力预测蛋白质结构的主要的障碍在于典型的蛋白质解的空间非常大,一种蛋白质就可能有10的300次方种结构。美国分子生物学家Cyrus Levinthal曾估算过,如果用蛮力来计算蛋白质所有可能的构型,所需要的时间可能比宇宙存在的时间都要长。人工智能程序AlphaFold2是如何解决这一问题的呢?

 AlphaFold2在进行数据迭代过程中有四个关键技术用来加速计算,利用“自注意力+三角形乘法”模型,设定“局部坐标系”,引入“不变点注意力”机制,最后增加“损失函数”来判断相似度。

AlphaFold2的搜索数据库达到了2.2T的存储量,训练阶段共使用了25个氨基酸对,再用6亿个氨基酸做微调。它使用的算力并不大,只用了谷歌128个TPU,一个TPU相当于4个GPU,加在一起就相当于是512张板卡。模型训练用了7天时间,微调用了4天时间,一共11天,就把问题解决了。 人工智能AlphaFold2预测蛋白质结构给了我们启发,芯片设计能不能也按照这个思路做? 

 

AI能给芯片行业带来什么?

我认为,从芯片设计到制造,人工智能都能给芯片行业带来好处,包括芯片设计中的布线、数字设计和模拟设计等环节。

芯片的整个制造流程较长,包含架构设计、逻辑设计、逻辑合成、物理设计、系统验证、封装测试等,而在某一环节中又涉及到各种各样的细节和大量的数据。在制造的过程中,比如在掩膜过程有很多技术调整,但目前很多工艺都是靠经验完成的,这些经验其实可以通过训练AI来提高效率和设计质量。

设计的质量提高之后成本会大大降低。随着晶体管数增加、芯片功能越来越多,芯片设计的复杂性和人力成本也大大增加。

怎样把芯片设计的成本降下来呢?2018年,美国国防部高级研究计划局DAPRA专门设了一个课题,芯片设计是否可以按照与摩尔定律同样曲线往上增长?这是一个挑战问题,与蛋白质原理有点相似。这个挑战西方是如何解决的?人需要睡觉,但如果用机器做设计,特别是布线优化,可以24小时连轴转。他们利用人工智能程序代替人力,希望可以把成本直接降下来。

第一个切入的问题就是布线。集成电路布线在计算机领域属于NP难题,归属于最小数的结构搜索问题。比如,想要找出网络的最优拓扑结构,就要把所有可能搜索完之后,才能知道哪一个是最优的。如果网络复杂了,搜索过程也会变得非常复杂。这个问题可与下围棋做比较,围棋状态数是10的361次方,这个空间非常大,当年AlphaGo在这个空间上,用176个 GPU上训练40天才诞生。

如果要想解决这个问题,要找到科学问题的关键,它是拓扑结构,还是资源共享?怎样使线网之间的耦合在空间和资源上做到平衡?这是一个最大的挑战。目前产业内,还依赖人的经验。如果可以开源芯片数据集+人工智能去优化这一环节,效率将大大提升。

EDA设计可以用人工智能做大部分的布线优化,学术界从三年前就开始进行探索。2018年学术界用深度神经网络布线,2020年开始引入强化学习,也有用图神经网络做小样本学习研究的,也有用迁移学习、主动学习做研究的,这些都是今年最新的结果。

在EDA领域AI还未大规模应用,但已有大公司应用。比如Synpsys的DSO.ai 和Cadence的Cerebras利用AI加速设计空间探索,Mentor Graphics Calibre利用AI辅助光刻掩膜综合与验证。 此外,业内还有三个AI在IC领域应用的成功案例:基于深度学习来做GPU加速和设计;用AI模拟IC Analog工作;用AI做光刻建模图像转换。反过来,集成电路也可以帮助人工智能,比如光子AI芯片。人工智能非常需要光计算辅助,但目前光计算芯片的设计人员、工具还不完备,人工智能的发展需要集成电路产业界的帮助。 

 

鹏城实验室的AI for IC布局

目前来看,人工智能融入集成电路产业面临着三大问题:缺少问题,如何定位EDA中有价值且可尝试用AI解决的问题?缺少数据,如何获取大量芯片数据,用于训练AI模型?缺少平台,如何验证一个算法的有效性,并将其转化为系统成功?如何构建属于IC的ImageNet和TensorFlow,把AI的强大能力嫁接到IC设计和EDA工具领域?接下来我为大家介绍下鹏程实验室在这方面的进展。鹏城实验室是作为国家战略科技力量之一,主要聚焦网络、通讯、智能等方向。鹏城实验室希望将人工智能的经验在不同领域融合发展,集成电路是其中一个重要领域。 我们首先考虑到了EDA,希望用开源办法做EDA,在EDA耗时最长的部分用人工智能取代人力。

我们的思路是先从数据库切入,把EDA比较难的问题一个模块一个模块地用AI算法替换,这在我们发布的EDA白皮书中有较为详细的介绍。鹏程实验室的开源EDA实验平台,底层基础硬件是与华为联手建设的鹏城云脑,做16位半浮点运算,算力可达10的18次方每秒。中间层是集成软件,上层是云脑软件平台。就在昨天11月12日,国际人工智能算力性能排行榜AIPerf500发布,“鹏城云脑II”蝉联榜首。

不同的厂商数据都上云后,数据的安全性如何保证?鹏城云脑专门设计了一套名为DPI的数据程序接口,提供一套框架和保护措施,构建防水堡。把数据、模型应用中间用DPI隔开,再引入一套保护机制,从数据拥有方、模型加工厂、数据需求方,在模型加工厂和下面数据拥有方之间增加一整套可行环境机制,使得拥有方完全掌控数据的情况。 

 

结语

人工智能AI和集成电路IC是互利互助的,人工智能可以在EDA、芯片设计、芯片制造等领域提升效率,节约成本;集成电路的发展也可以帮助人工智能提升、突破算力。真诚的希望集成电路产业界可以与我们一起探讨AI和IC的融合发展。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
S2B-PH-SM4-TB(LF)(SN) 1 JST Manufacturing Board Connector, 2 Contact(s), 1 Row(s), Male, Right Angle, Surface Mount Terminal, ROHS COMPLIANT

ECAD模型

下载ECAD模型
$0.43 查看
43030-0001 1 Molex Wire Terminal,

ECAD模型

下载ECAD模型
$0.07 查看
BT137S-600D,118 1 NXP Semiconductors BT137S-600D
$0.93 查看

相关推荐

电子产业图谱

芯谋研究(ICwise),领先的半导体产业研究机构,中国专注在半导体领域的研究公司,以 "独立 专业 权威"为原则,以"芯动中国,谋略天下"为使命,致力于成为全球领先的科技行业研究机构。