在近日举行的英特尔人工智能开发者大会上,英特尔公司全球副总裁兼人工智能产品事业部总经理 Naveen Rao 提到,英特尔正在与诺华合作,利用深度神经网络来加速高内涵筛选——这是早期药品研发的关键因素。双方的合作把训练图片分析模型的时间从 11 个小时缩短到了 31 分钟——改善了 20 多倍[1]。
 
细胞表型的高内涵筛选是支持早期药品研发的关键工具,“高内涵”一词是指利用传统图像处理技术从图像中提取的丰富数据集,这些数据集由数千个预定义特性(如大小、形状、肌理等)构成。通过高内涵筛选可以分析显微镜图像,进而研究数千种基因或化学治疗方法对不同细胞的培养效果。
 
 
深度学习有望做到的是从数据中“自动”学习如何通过相关图像特征将一种治疗方法与另一种治疗方法区分开。英特尔与诺华的生物学家和数据科学家希望通过利用深度神经网络加速技术,提高高内涵图像筛选的速度。在双方的合作中,团队并非通过独立的步骤鉴别出图像中的各个细胞,而是聚焦于完整的显微镜图像,但完整的显微镜图像远远大于深度学习数据集里的图像,例如英特尔与诺华合作评估中使用的图片就比典型的动物、物体和场景数据集 ImageNet*中的图像大 26 倍以上。
 
深度卷积神经网络模型在分析显微镜图像时可同时分析一张图像中的几百万个像素或者一个模型中的几百万个参数,甚至还能同时分析数千个训练图像,这些构成了很高的计算工作量,即使采用最先进的计算性能也无法有足够时间对 DNN 模型展开深入研究。为了解决这一挑战,英特尔联手诺华利用深度神经网络加速技术处理多个图像,大大缩减了时间并提高工作效率,同时让模型从图像特性中获得更加丰富的洞察。具体讲就是通过使用 Broad Bioimage Benchmark Collection* 021 (BBBC-021) 数据集,英特尔与诺华合作团队将总处理时间缩短至 31 分钟,准确率超过 99%;利用深度学习训练中的数据并行性原则,并充分依靠服务器平台上的大存储支持,通过了 32 个 TensorFlow* workers,实现了每秒处理 120 个 3.9 兆像素图像的成果。
 
与诺华的合作,是英特尔通过企业级的解决方案为人工智能的应用与企业部署提供最广泛的计算力合作案例之一。在未来,虽然监督学习对于加快图像分类、缩短获得洞察的时间至关重要,但却仍需要依赖大量专家标记的数据集来训练模型,建立此类数据集所需的时间和工作量往往超出现实条件。无监督学习或许可以应用于无标记的显微镜图像,有望在细胞生物学领域发现新洞察,有助于人类药物研发的进一步发展。
 
[1] 20 倍是通过从单节点系统扩展到 8 插槽集群实现的 21.7 倍速度提升。
 
8 插槽集群节点配置:CPU:英特尔®至强® 6148 处理器(2.4GHz);核心数:40;插槽数:2;超线程:启用;内存 / 节点:192GB,2666MHz;网卡:英特尔® Omni-Path Host Fabric Interface (英特尔® OP HFI);TensorFlow:v1.7.0;Horovod:0.12.1;OpenMPI:3.0.0;集群:ToR Switch:英特尔® Omni-Path Switch
 
单节点配置:CPU:英特尔®至强®融核处理器 7290F;192GB DDR4 RAM;1x 1.6TB 英特尔® SSD DC S3610 系列 SC2BX016T4;1x 480GB 英特尔® SSD DC S3520 系列 SC2BB480G7;英特尔® MKL 2017/DAAL/Intel Caffe