第五代CEVA图像及视觉技术简化了在低功耗嵌入式器件上实现强大深度学习的工作

2016-10-13 15:09:42 来源:EEFOCUS
标签:

·全面的视觉平台集成了新的CEVA-XM6 DSP内核、硬件加速器、神经网络软件框架、软件库和广泛的算法支持

·推动实现面向大众市场智能视觉应用的嵌入式神经网络

·面向自主驾驶、感应和躲避式无人机、虚拟和增强现实、智能监控、智能手机、机器人等应用

 

专注于智能互联设备的全球领先信号处理IP授权公司CEVA宣布推出一款基于DSP的全新产品,为低功耗嵌入式系统带来深度学习和人工智能(AI)能力。这款全面的可扩展集成硬件和软件IP平台的核心是全新图像和视觉DSP CEVA-XM6 ,使得开发人员能够高效地利用神经网络和机器视觉能力,用于智能手机、无人驾驶车辆、监控、机器人、无人机和其它带有相机功能的智能器件。

 

与上一代CEVA-XM4智能视觉DSP相比,这个基于CEVA-XM6的新型视觉平台的神经网络性能提高至八倍,所有计算机视觉内核性能改善达到三倍。这个新型架构集成的关键增强功能包括新的矢量和标量处理单元,以及指令集、存储带宽和 DMA的大量增强功能。

 

这个新型视觉平台进一步扩展了CEVA产品在实施神经网络时与采用GPU的主流架构相比的性能优势。与用于计算机视觉和深度学习的领先GPU嵌入式系统相比,CEVA最新的图像和视觉平台的性能每瓦特效率(performance-per-watt efficiency)提升25倍以上,用于AlexNet和GoogLeNet等卷积神经网络(CNN)的处理速度加快四倍。 

 

CEVA视觉业务部副总裁兼总经理Ilan Yona称:“随着计算机视觉和深度学习技术成为主流,我们需要在高功耗GPU引擎产生的深度神经网络和部署这些功率和性能受限的嵌入式应用之间架起桥梁,消除中间的鸿沟。我们的新型视觉平台在这方面非常出色,为开发人员提供最全面的技术集,能够快速应对这些嵌入式使用案例。”

 

这款视觉平台集成了大量软件和硬件IP,为在嵌入式系统中部署机器视觉和深度学习提供上市时间和功率优势。除CEVA-XM6 DSP本身之外,这平台还包括CNN特定功能加速器和图像去扭曲(针对所有类型的图像变换)、CEVA受到广泛赞誉的CDNN2神经网络软件框架、OpenCV、OpenCL和OpenVX API、CEVA-CV计算机视觉库,以及一组广泛应用的优化算法。

 

嵌入式视觉联盟创立者Jeff Bier道:“各种终端产品的设计人员都渴望在其设计中集成视觉智能。通常,这些开发人员使用的视觉和深度学习算法要求以低成本、低功耗,并且可编程的方法提供极高的处理性能。我非常赞赏CEVA长期致力于提供满足这些需求的处理器和软件工具。”

 

技术特点

CEVA-XM6以强大的CEVA-XM4和CEVA-MM3101处理器为基础,并已经有了超过25个设计项目。它具备了一系列提供突破性神经网络性能和高级计算机视觉处理能力的架构创新和增强功能,包括:

 

·创新矢量处理单元(VPU)架构:确保95%以上的MAC利用率,是现今业界中无人能及的卓越水平

 

·增强并行分散 – 集中存储负荷机制:进一步改善视觉算法性能,包括SLAM和深度映射。

 

·Sliding Window 2.0™ :这个专利机制利用图像处理的像素重叠,有助于在更广泛的神经网络中实现更高的利用率,以及适应这些网络日益增加的复杂性。

 

·选件32路SIMD矢量浮点单元,其中包括IEEE半精度标准(FP16)和重大的非线性运算增强。

 

·其它改进包括加速CNN性能的增强3D数据处理方案,与CEVA-XM4相比,控制代码性能改进了50%,并具有进一步缩小代码尺寸的新的可扩展单元及多核和系统集成支持。

 

除CEVA-XM6 DSP外,这种视觉平台的其它关键部件包括:

·CDNN加速器:16位CDNN加速器具有512 MACs/cycle,确保提供业界最佳性能以处理目前最复杂的神经网络。CDNN加速器还用于释放CEVA-XM6 DSP内的256 MAC单元,允许并行运行其它计算机视觉任务。这种灵活的方法使得CDNN加速器配合CEVA-XM6的架构成为了支持新的图像算法、网络结构和改变快速演变的深度学习空间中的层类型的最佳选择。

 

·图像去扭曲加速器 :对于宽角摄像头应用,比如360度摄像头来说,图像去扭曲加速器支持ARM帧缓冲压缩(AFBC)协议,提供最佳系统互操作性。

 

·加速器认知补充软件:在CEVA-XM6 DSP上运行,提供高效加速器利用率,使设计人员能够进一步差异化其产品设计。

 

·CDNN2软件框架:经优化及与CEVA-XM6和加速器协作,使得开发人员很容易利用此工具生成并将其专有神经网络移植到CEVA-XM6上,从而显着加速利用最新最先进的网络拓扑和层的性能,包括支持Caffe和Google的机器学习软件库TensorFlow。

 

·符合ISO 26262主动安全性的产品包:在汽车应用场合支持下一代ADAS和自主驾驶解决方案的需求。

 

CEVA的CDNN2软件框架同时针对CEVA-XM6和CDNN加速器优化,完全支持16位定点精度,确保运行在32位浮点环境中培训的网络时精度降低小于1%。这是神经网络从研发过渡到面向大批量汽车和消费者应用的高成本和功率效益解决方案的关键。

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
低功耗SiC二极管实现最高功率密度

相较于硅,碳化硅(SiC)肖特基二极管采用全新的技术,提供更出色的开关性能和更高的可靠性。SiC无反向恢复电流,且具有不受温度影响的开关特性和出色的散热性能,因此被视为下一代功率半导体。

Nordic参展CES Asia 2018:打出一套低功耗蓝牙组合拳

Nordic是全球领先的低功耗蓝牙芯片供应商,拥有全球40%的市场份额,并且将于2018年底进入蜂窝IoT市场。

现在起,SimpleLinkTM 低功耗 Bluetooth® 无线 MCU支持阿里云Link物联网平台

在创新技术的推动下,智能锁、可穿戴设备等物联网应用已经成为时下、甚至是引领未来几年物联网快速发展的主流。

低功耗、无线充电功率、阻抗匹配、射频性能、EMI等测试 世强开放实验室免费提供

不难发现,在产品研发生产的过程当中,企业往往会在测试上遭遇一种抉择上的困难。比如,对于初创企业而言,本身资金就比较有限,产品测试是必备但不常用的事宜,那么是应该购买测试仪器,还是去专业的测试机构测试呢?

Dialog公司推出超低功耗且紧凑的触觉控制驱动IC,进入迅速增长的触控市场

高度集成电源管理、AC/DC电源转换、充电和蓝牙低功耗技术供应商Dialog半导体公司(德国证券交易所交易代码:DLG)日前宣布,推出一款新型触觉控制驱动IC -- DA7280,该器件能驱动ERM(偏心旋转质量)和LRA(线性谐振传动器)电机,提供高清(HD)宽带驱动。

更多资讯
UltraSoC嵌入式分析技术与Imperas虚拟平台联手助力多核开发及调试

UltraSoC和Imperas今日宣布:双方将达成一项广泛的合作,为多核系统级芯片(SoC)开发人员提供结合了嵌入式分析技术和虚拟平台技术的强大组合。

莫大康:迎接存储器业的挑战

较为乐观的估计,能用5年左右的时间,达到全球市场(2018年存储器业产值预测可达1,500亿美元)占比的3% - 5%,也即DRAM与NAND的累加产值能达到近50亿美元,表明中国存储器业的突围取得了初步的成功。

宜鼎iCAP云端管理平台实现终端远程智能管理,降低人力成本

宜鼎芯存Innodisk于今年Computex现场展出iCAP云端储存管理平台,以软件、硬件及固件跨界整合的优势,强势承接全球持续升温的智能工控管理需求。

JTAG和支持JTAG的CPU

通常所说的JTAG大致分两类,一类用于测试芯片的电气特性,检测芯片是否有问题;一类用于Debug;一般支持JTAG的CPU内都包含了这两个模块。

旺宏电子:NOR Flash与NAND Flash内存都满载啦

内存供货商旺宏电子(Macronix),今日举行股东会,董事长吴敏求表示,NOR Flash与NAND Flash内存的需求持续满载,工业与车用的比例将进一步提升。

Moore8直播课堂
电路方案