Cadence发布业界首款面向汽车、监控、无人机和移动市场的神经网络DSP IP

2017-05-04 20:32:00 来源:EEFOCUS
标签:

楷登电子(美国Cadence公司,NASDAQ: CDNS)今日正式公布业界首款独立完整的神经网络DSP —Cadence® Tensilica® Vision C5 DSP,面向对神经网络计算能力有极高要求的视觉设备、雷达/光学雷达和融合传感器等应用量身优化。针对车载、监控安防、无人机和移动/可穿戴设备应用,Vision C5 DSP 1TMAC/s的计算能力完全能够胜任所有神经网络的计算任务。

随着神经网络应用的日益深入和复杂,对计算的要求也与日俱增;同时,神经网络的自身架构在不断更新换代,新网络、新应用和新市场也层出不穷。上述趋势之下,业界亟需一款针对嵌入式系统量身定制的高性能、通用型神经网络解决方案,不仅应该具备极低的功耗,还应拥有高度的可编程能力,以适应未来变化,降低风险。

神经网络DSP vs. 神经网络加速器
基于摄像头的视觉系统在汽车、无人机和安防领域最为常见,这种架构需要两种最基础的视觉优化计算模式。首先,利用传统视觉算法对摄像头捕捉到的照片或图像进行增强;其次,使用基于神经网络的认知算法对物体进行检测和识别。现有的神经网络加速器解决方案皆依赖与图像DSP连接的硬件加速器;神经网络代码被分为两部分,一部分网络层运行在DSP上,卷积层则运行在硬件加速器上。这种架构不但效率低下,且耗能较高。

Vision C5 DSP是专门针对神经网络进行了特定优化的DSP,可以实现全神经网络层的计算加速(卷积层、全连接层、池化层和归一化层),而不仅仅是卷积层的加速。因此,主视觉/图像DSP能力得以释放,独立运行图像增强应用,Vision C5 DSP则负责执行神经网络任务。通过移除神经网络DSP和主视觉/图像DSP之间的冗余数据传输,Vision C5 DSP的功耗远低于现有的神经网络加速器。同时,Vision C5 DSP还提供针对神经网络的单核编程模型。

“我们的很多客户都在纠结如何选择理想的神经网络平台,毕竟一款产品的开发可能耗时数年,”Cadence公司Tensilica事业部市场高级总监Steve Roddy表示。“随时在线(always-on)嵌入式系统的神经网络处理器不仅需要低功耗和较快的图像处理速度,灵活性和永不过时(future-proof)的前瞻性也必不可少。目前的平台都不够理想,客户亟需一个全新的解决方案。Vision C5 DSP通用型神经网络DSP应运而生,它集成方便、使用灵活,功耗能效较CNN加速器、GPU和CPU也更为出色。”

“现实世界中的深度学习应用数量庞大,种类繁多,对计算的要求非常苛刻,”嵌入视觉联盟(Embedded Vision Alliance)创始人Jeff Bier表示。“Vision C5 DSP作为神经网络专用编程处理器,可以帮助我们在低成本、低功耗设备上应用深度学习技术。”

Vision C5 DSP的参数与性能
依托独立引擎,Vision C5 DSP具备领先的神经网络性能:

·不到1mm2的芯片面积可以实现1TMAC/秒的计算能力(吞吐量较Vision P6 DSP提高4倍),为深度学习内核提供极高的计算吞吐量
·1024 8-bit MAC或512 16-bit MAC 确保8-bit 和16-bit精度的出色性能
·128路8-bit SIMD或64路16-bit SIMD的VLIW SIMD架构
·专为多核设计打造,以极少的资源代价获得NxTMAC的处理能力
·内置iDMA和AXI4总线接口
·使用与Vision P5和P6 DSP一致的经验证软件工具包
·基于业界知名的AlexNet CNN Benchmark,Vision C5 DSP的计算速度较业界的GPU最快提高6倍;Inception V3 CNN benchmark,有9倍的性能提升。

Vision C5 DSP是一款灵活前瞻的永不过时(future-proof)解决方案,支持各类内核尺寸、深度和输入规格。Vision C5 DSP采用多项系数压缩/解压技术,支持未来添加的新计算层。与之相反,CNN硬件加速器由于程序重编能力有限,扩展能力较差。

Vision C5 DSP搭载Cadence神经网络Mapping工具链,可将Caffe和TensorFlow等映射为在Vision C5 DSP上高度优化过的可执行代码,充分发挥手动优化神经网络库的丰富功能。

 

Cadence正与多家早期客户展开合作。如需了解Vision C5 DSP的详细内容,请联系您的Cadence销售代表。

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
天鹰兄弟植保无人机亮相新西兰国际农业博览会

6月12日,一年一度的南半球规模最大的农业展—2019新西兰国际农业博览会(Fieldays)如期在哈密尔顿市神秘谷(Mystery Creek)会展中心盛大开幕。

特斯拉股东大会圆满结束,马斯克表示:将最快实现特斯拉“国产”

据外媒报道,无人机视频更新显示,特斯拉上海电动汽车工厂的建筑几乎已经完工,特斯拉已经在安装电动车生产线设备。在上周举行的特斯拉股东大会上,特斯拉首席执行官埃隆·马斯克表示,特斯拉上海工厂将在今年夏天如期建设完成,“这是我见过的建成速度最快的建筑,在未来它具备年产50万甚至100万辆电动车的潜力。”

用意念操控无人机什么操作?脑控耳机何时才能到来?
用意念操控无人机什么操作?脑控耳机何时才能到来?

我们不妨先来想象一个场景:你戴着耳机听着音乐,精神放松,然后大脑在一瞬间集中精神想象着“下一曲”或者“调大音量”,接下来耳机便会执行相应的操作。

无人机飞行如何控制?加速度传感器和陀螺仪是否真的缺一不可?

在无人飞行器的飞机姿态控制这一重要应用上,以MEMS加速度传感器、MEMS陀螺仪为主的传感类硬件的应用可谓是大放异彩。

无人机如何知道自己的位置?悬停精度究竟如何?

自动悬停的意思就是将无人机固定在预设的高度位置与水平位置上,其实也就是一组三维座标。不过,无人机是如何知道自己的位置的呢?其实说起来也很简单,高度一般来说是通过超声波传感器(测量与地面的距离,比较少见)或者是气压计(高度会影响大气压的变化)来测量的,而水平位置的座标则由GPS模块来确定。

更多资讯
芯片国产率只有4.2%,中国半导体在10年内不可能自给自足

半导体要想实现自给自足的任务,绝非一朝一夕就能完成的,媒体上有不少乐观情绪认为中国公司在未来3-5年里就能在半导体技术上追赶上国际领先的供应商

Intel打造22FFL工艺 生产超强寿命RRAM芯片

Intel之前还有一些工厂是生产22nm工艺的,它们也不可能完全淘汰或者升级到7nm,所以2017年Intel推出了22FFL工艺。

由芯片研发模式引发的问题该如何解决?

Google的TPU芯片专门为云端AI应用设计,可谓是为云而生。而TPU的设计过程又越来越多的利用了云的优势,可谓是生于云中。TPU所带来的创新,不仅仅是芯片架构,还反映在整个芯片研发的思路,方法,甚至是“文化”,而后者可能对整个产业都会带来更为深远的影响。

中国芯片产业最缺的是领军人物

中国每年进口3000亿美元芯片,是第一大宗进口物资。从美国制裁中兴到围剿华为,已经使国民认识到了芯片的重要性,同时也引起广泛质疑

从低端向高端的转变成为必然趋势,优秀团队才值得投资

创新是引领发展的第一动力,在作为关乎国家信息安全的命脉的集成电路领域也是如此。