加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

NVIDIA 和 Evozyne 创建用于生成蛋白质的生成式 AI 模型

2023/01/13
1663
阅读需 5 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

科学家使用 NVIDIA BioNeMo 创建出能够生成高质量蛋白质的大型语言模型,以此加快药物研发并助力创造更具可持续性的环境。

摩根大通医疗健康大会 - 初创企业 Evozyne 使用 NVIDIA 提供的预训练 AI 模型,创造了两种在医疗和清洁能源领域具有重大潜力的蛋白质。

今日发布的一篇联合论文描述了这一过程及产出的蛋白质氨基酸序列。其中一种蛋白质用于治疗一种先天性疾病,另一种用于消耗二氧化碳以减少全球变暖。

初步研究结果展示了一种加速药物研发的新方法。

Evozyne 联合创始人、论文共同作者 Andrew Ferguson 表示: “令人欣喜的是,这个 AI 模型第一轮产出的合成蛋白质就像自然生成的蛋白质一样,表示该模型已经学会了自然界的设计规则。”

革命性的AI模型

Evozyne使用了NVIDIA的ProtT5。ProtT5是一个Transformer模型,是用于创建医疗AI模型的软件框架和服务——NVIDIA BioNeMo的一部分。

分子工程师 Ferguson 的研究领域涵盖化学和机器学习领域,他表示:“BioNeMo 非常强大,让我们能够训练模型,然后以非常低的成本使用该模型来运行工作任务,在几秒钟内就能生成数百万个序列。”

该模型是 Evovyne ProT-VAE 流程的核心。ProT-VAE 是一个工作流,其将 BioNeMo 与作为过滤器的变分自编码器(VAE)相结合。

他表示:“几年前,还没有人注意到可以使用大型语言模型与变分自编码器相结合的方式来设计蛋白质。”

让模型向大自然学习

就如同人读万卷书,NVIDIA 的 Transformer 模型会读取数百万种蛋白质中的氨基酸序列。该模型运用神经网络用来理解文本的技术,学会了大自然如何构建蛋白质氨基酸序列。

然后,该模型预测了如何组装出能够满足 Evozyne 需求的新蛋白质。

他表示:“这项技术正在助力我们开展工作,以实现十年前无法实现的梦想。”

无限的可能性

机器学习有助于研究海量可能的氨基酸组合,然后有效地识别最有用的序列。

传统的蛋白质工程设计方法,即定向进化,采用的是一种缓慢、无计划的方法,通常一次只改变几个氨基酸的序列。


vozyne的ProT-VAE流程采用了NVIDIA BioNeMo中强大的Transformer模型,生成有用的蛋白质,进而助力药物研发和能源领域实现可持续性。

相比之下,Evozyne 的方法只通过一轮,就能改变一个蛋白质中半数乃至以上的氨基酸。这相当于进行了数百次的突变。

他表示:“我们正在实现技术上的飞跃,这使我们能够探索以前从未见过的、具有有用的新功能的蛋白质。”

Evozyne计划使用新的工艺来构建各种能够对抗疾病和气候变化的蛋白质。

缩短训练时间,扩大模型规模

Ferguson表示:“NVIDIA 在此方面是一家非常出色的合作伙伴。”

Evozyne 数据科学家Joshua Moller表示: “他们通过将工作扩展到多个 GPU 来加快训练速度。

这将训练大型 AI 模型的时间从几个月缩短到一个星期。Ferguson 表示:“所以我们能够训练出原本不可能训练出的模型,比如一些有数十亿可训练参数的模型。”

未来将更加令人期待

使用 AI 加速蛋白质工程的前景十分广阔。

Ferguson 注意到了扩散模型近期的发展: “这个领域的发展速度快得令人难以置信,我真的很期待日后的进一步发展。”

“没人知道我们五年后将能够走多远。”

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
MKL02Z32VFG4R 1 Freescale Semiconductor RISC MICROCONTROLLER

ECAD模型

下载ECAD模型
暂无数据 查看
DS3231SN# 1 Maxim Integrated Products Real Time Clock, Non-Volatile, 1 Timer(s), CMOS, PDSO16, 0.300 INCH, SOIC-16
$11.21 查看
ATMEGA644PA-AU 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 44TQFP

ECAD模型

下载ECAD模型
$4.94 查看
英伟达

英伟达

为这个时代的达芬奇和爱因斯坦们提供超强计算性能。我们开创性地开发出一种超强计算形式,深受全世界对计算机有超高要求的用户的青睐,包括科学家、设计师、艺术家和游戏玩家。对于他们而言,我们的创造几乎可媲美时间机器。基于对更优质 3D 图形永无止境的需求以及当下庞大的游戏市场,NVIDIA 已在这个虚拟现实、高性能计算和人工智能的交叉口,将 GPU 发展为计算机大脑。

为这个时代的达芬奇和爱因斯坦们提供超强计算性能。我们开创性地开发出一种超强计算形式,深受全世界对计算机有超高要求的用户的青睐,包括科学家、设计师、艺术家和游戏玩家。对于他们而言,我们的创造几乎可媲美时间机器。基于对更优质 3D 图形永无止境的需求以及当下庞大的游戏市场,NVIDIA 已在这个虚拟现实、高性能计算和人工智能的交叉口,将 GPU 发展为计算机大脑。收起

查看更多

相关推荐

电子产业图谱