新闻摘要:
·全新的 Arm® IP 套件为终端设备带来机器学习(ML)能力
·基于高效能和高效率设计架构的 Arm 机器学习与目标检测 (Object Detection) 处理器 , 能提供最广泛的应用范围并带来最佳的用户经验
·这些新产品能让移动设备具备实现每秒数万亿次的机器学习操作的能力。
 
Arm 公司近期宣布了其 Project Trillium 项目,这是一套包括新的高度可扩展处理器的 Arm IP 组合,这些产品可以提供增强的机器学习(ML)和神经网络(NN)功能。当前的技术产品主要针对移动设备市场,将让全新的搭载机器学习功能的设备具有先进的计算能力,包括最先进的目标检测功能。
 
Arm IP 产品事业部总裁 Rene Haas 表示:“随着人工智能快速部署到终端设备,大量提升计算需求的同时,也要求保持出色的能效表现。 基于这样的需求,Arm 宣布推出全新机器学习平台 Project Trillium。 新的设备需要高性能的机器学习与人工智能能力,这正是这些全新处理器可以提供的。 结合我们的平台提供的高度灵活性和可扩展性,我们的合作伙伴将可针对多种设备进行创新,创造无限可能。
 
现在的机器学习技术通常是针对特定的设备类别或某个市场领域的需求。Arm 的 Project Trillium 则通过提供最佳的可扩展性来改变这一点。虽然最初的发布是针对移动处理器的,但未来的 Arm 机器学习产品系列将会按照性能需求满足不同应用场合的需求,包括从传感器、智能音箱,到移动设备、家庭娱乐以及其他领域的应用。
 
性能
Arm 全新的机器学习和目标检测处理器不仅相比于独立的 CPU, GPU 和各种加速器有了显著的效率提升,而且远胜像 DSP 这样的传统可编程逻辑处理器。
        
Arm 机器学习处理器是专门针对机器学习而重新设计的。它基于高度可扩展的 Arm 机器学习架构, 并达到了机器学习应用场景要求的最高性能和效率:
 
·在移动计算领域,Arm 机器学习处理器可以提供每秒超过 4.6 万亿次的运算能力。
· 凭借智能数据管理,每秒万亿次的运算(TOPs, Trillion Operations Per Second)在实际应用中可以进一步实现 2~4 倍的有效吞吐量的提升。
·在散热和和成本受限的环境下,Arm 机器学习处理器能够以超过每瓦特每秒 3 万亿次运算操作的效能(TOPs/W)达到无以伦比的性能。有关 Arm 机器学习处理器的更多细节可在我们的网站上找到。
 
Arm 目标检测处理器是专门为高效识别人或其他物体而设计的,它能够在每帧图像中识别出的物体对象的数目几乎不受限制:
 
·在全高清分辨率下可以做到实时每秒 60 帧的检测。
·性能可以达到传统 DSP 的 80 倍,并且相对于以往的 Arm 技术,检测质量有了显著提高。有关 Arm 目标检测处理器的更多细节可在我们的网站上找到。
 
组合使用时,Arm 深度学习处理器和目标检测处理器性能表现会更好,它们搭配能够提供高性能、高能效的人物检测和识别解决方案。基于这些技术,用户们将会在省电的模式下,在他们的智能设备上尽情体验高分辨率的,且实时、精细的人脸识别功能。
 
当和 Arm Compute Library 和 CMSIS-NN 一起使用时, Arm 神经网络(NN)软件库专门为神经网络运算(NN)进行了优化,并且无缝的把如 TensorFlow、Caffe 和 Android NN 等神经网络框架和全系列的 Arm Cortex® CPU, Arm Mali™ GPU, 和机器学习处理器高效连接在一起。这样开发人员能够充分利用底层 Arm 硬件的能力和性能,从而从 ML 应用中获得最高的性能。关于 Arm NN 软件的更多细节可在我们的网站上找到。
 
新的 Arm 机器学习 IP 套件将于今年 4 月有早期预览版本提供给客户,在 2018 年中会发布通用版本。