Cadence发布业界首款面向汽车、监控、无人机和移动市场的神经网络DSP IP

2017-05-04 20:32:00 来源:EEFOCUS
标签:

楷登电子(美国Cadence公司,NASDAQ: CDNS)今日正式公布业界首款独立完整的神经网络DSP —Cadence® Tensilica® Vision C5 DSP,面向对神经网络计算能力有极高要求的视觉设备、雷达/光学雷达和融合传感器等应用量身优化。针对车载、监控安防、无人机和移动/可穿戴设备应用,Vision C5 DSP 1TMAC/s的计算能力完全能够胜任所有神经网络的计算任务。

随着神经网络应用的日益深入和复杂,对计算的要求也与日俱增;同时,神经网络的自身架构在不断更新换代,新网络、新应用和新市场也层出不穷。上述趋势之下,业界亟需一款针对嵌入式系统量身定制的高性能、通用型神经网络解决方案,不仅应该具备极低的功耗,还应拥有高度的可编程能力,以适应未来变化,降低风险。

神经网络DSP vs. 神经网络加速器
基于摄像头的视觉系统在汽车、无人机和安防领域最为常见,这种架构需要两种最基础的视觉优化计算模式。首先,利用传统视觉算法对摄像头捕捉到的照片或图像进行增强;其次,使用基于神经网络的认知算法对物体进行检测和识别。现有的神经网络加速器解决方案皆依赖与图像DSP连接的硬件加速器;神经网络代码被分为两部分,一部分网络层运行在DSP上,卷积层则运行在硬件加速器上。这种架构不但效率低下,且耗能较高。

Vision C5 DSP是专门针对神经网络进行了特定优化的DSP,可以实现全神经网络层的计算加速(卷积层、全连接层、池化层和归一化层),而不仅仅是卷积层的加速。因此,主视觉/图像DSP能力得以释放,独立运行图像增强应用,Vision C5 DSP则负责执行神经网络任务。通过移除神经网络DSP和主视觉/图像DSP之间的冗余数据传输,Vision C5 DSP的功耗远低于现有的神经网络加速器。同时,Vision C5 DSP还提供针对神经网络的单核编程模型。

“我们的很多客户都在纠结如何选择理想的神经网络平台,毕竟一款产品的开发可能耗时数年,”Cadence公司Tensilica事业部市场高级总监Steve Roddy表示。“随时在线(always-on)嵌入式系统的神经网络处理器不仅需要低功耗和较快的图像处理速度,灵活性和永不过时(future-proof)的前瞻性也必不可少。目前的平台都不够理想,客户亟需一个全新的解决方案。Vision C5 DSP通用型神经网络DSP应运而生,它集成方便、使用灵活,功耗能效较CNN加速器、GPU和CPU也更为出色。”

“现实世界中的深度学习应用数量庞大,种类繁多,对计算的要求非常苛刻,”嵌入视觉联盟(Embedded Vision Alliance)创始人Jeff Bier表示。“Vision C5 DSP作为神经网络专用编程处理器,可以帮助我们在低成本、低功耗设备上应用深度学习技术。”

Vision C5 DSP的参数与性能
依托独立引擎,Vision C5 DSP具备领先的神经网络性能:

·不到1mm2的芯片面积可以实现1TMAC/秒的计算能力(吞吐量较Vision P6 DSP提高4倍),为深度学习内核提供极高的计算吞吐量
·1024 8-bit MAC或512 16-bit MAC 确保8-bit 和16-bit精度的出色性能
·128路8-bit SIMD或64路16-bit SIMD的VLIW SIMD架构
·专为多核设计打造,以极少的资源代价获得NxTMAC的处理能力
·内置iDMA和AXI4总线接口
·使用与Vision P5和P6 DSP一致的经验证软件工具包
·基于业界知名的AlexNet CNN Benchmark,Vision C5 DSP的计算速度较业界的GPU最快提高6倍;Inception V3 CNN benchmark,有9倍的性能提升。

Vision C5 DSP是一款灵活前瞻的永不过时(future-proof)解决方案,支持各类内核尺寸、深度和输入规格。Vision C5 DSP采用多项系数压缩/解压技术,支持未来添加的新计算层。与之相反,CNN硬件加速器由于程序重编能力有限,扩展能力较差。

Vision C5 DSP搭载Cadence神经网络Mapping工具链,可将Caffe和TensorFlow等映射为在Vision C5 DSP上高度优化过的可执行代码,充分发挥手动优化神经网络库的丰富功能。

 

Cadence正与多家早期客户展开合作。如需了解Vision C5 DSP的详细内容,请联系您的Cadence销售代表。

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
Cadence:10nm以后挑战重重,人工智能和机器学习正在酝酿一场变革

华为麒麟980的发布,开启了手机芯片的7nm时代,新的工艺节点带来了CPU、GPU、NPU的大幅性能提升,将手机芯片提升到了全新高度,但是新的工艺节点同样也让未来的芯片设计面临更多技术方面的挑战,生产设备成本太高,代工厂需要承担更大的风险,应用商需要负担更多的代工费用等等。

BSHARK推出氢动力无人机“Narwhal 2”

氢动力无人机研究方面的专业公司BSHARK与首款氢动力无人机HyDrone 1550的制造商深圳市科比特航空科技有限公司(简称“科比特”)开展合作。BSHARK由此发布了一款新的氢动力无人机“Narwhal 2”(独角鲸2号)。

人类和 DNN 的目标识别稳健性比较

深度神经网络在很多任务上都已取得了媲美乃至超越人类的表现,但其泛化能力仍远不及人类。德国蒂宾根大学等多所机构近期的一篇论文对人类和 DNN 的目标识别稳健性进行了行为比较,并得到了一些有趣的见解。机器之心对该论文进行了编译介绍。

无人机公司格局已定?除了大疆,无人生存

昨日(9月16日)最受行业关注的消息之一无疑是下面这则:无人机飞行系统设计商Airware突然向员工宣布,该公司将停止运营。

DARPA将开发无需手术的神经技术,实现脑机接口

到目前为止,DARPA(美国国防部高级研究计划局)的神经科学项目部(也称为国防部疯狂科学部门)一直专注于可服务于那些因身体或大脑残疾回国的士兵的技术,例如,资助了对连接到神经系统的假肢的研究和对可以治疗创伤后应激障碍的大脑植入物的研究。

更多资讯
2018年PCB行业大事件回顾

2018年以来,PCB行业延续了2017年的良好发展态势,各企业纷纷投建扩产。下半年以来,据不完全统计,PCB签约/开工项目总投资额就已超过223亿元人民币。

结构化布线系统网络的增加、去掉和改变

结构化布线" title="结构化布线">结构化布线" title="结构化布线">结构化布线系统网络有至少15年的使用寿命,因此网络的运营成本和升级成本将等于或超过最初的投资金额。在网络安装好后,增加、去掉和改变连接在网络中的设备通常需要较大的投入。

一种可靠并且简单的密码刷新输出电路

经常碰到这样的情况:因为MCU失效或跑飞造成误输出,损失惨重。很想做一种可靠并且简单(低成本,小体积)的密码刷新输出电路,但一直缺少某种灵感,做出来的东西比较蠢。

开关电源PCB印制板铜皮走线的注意事项

引言开关电源是一种电压转换电路,主要的工作内容是升压和降压,广泛应用于现代产品。因为开关三极管总是工作在 “开” 和“关” 的状态,所以叫开关电源。

PCB选择性焊接的工艺特点和流程

在PCB电子工业焊接工艺中,有越来越多的厂家开始把目光投向选择焊接,选择焊接可以在同一时间内完成所有的焊点,使生产成本降到最低,同时又克服了回流焊对温度敏感元件造成影响的问题,选择焊接还能够与将来的无铅焊兼容,这些优点都使得选择焊接的应用范围越来越广。

Moore8直播课堂
电路方案