加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    •  为什么采用64 位处理技术至关重要?
    •  提升机器学习性能
    •  实现高级安全功能
    •  对开发者的影响:软件和工具
    •  来自Arm和更广泛生态系统的支持
    •  总结
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

智能摄像头将迈入64位处理技术

2022/01/05
1014
阅读需 10 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

作者:Arm物联网兼嵌入式事业部业务拓展副总裁 马健

智能摄像头技术正在逐步改变我们的生活,而未来,它将为我们彼此以及与周围世界的互动方式带来深刻的变化。从打造更安全、更高效的智慧城市,到实现安全、经济和绿色的无人驾驶技术,到在热带雨林中监控非法砍伐,这些场景都对先进机器视觉技术的需求日益增长。在多样而复杂的人工智能AI)和机器学习(ML)应用场景对智能视觉系统的性能、实时性和可拓展性的推动下,摄像头系统越来越需要在端侧进行对图像、视频流以及其他传感器数据有效地进行分析处理,这就对摄像头硬件系统的处理能力的需求日益提高。简而言之,为了在边缘或终端摄像头上运行先进的AI工作负载,就需要更高性能的计算和智能数据处理技术,以满足高清成像、增强安全等应用需求。

随着笔记本电脑和智能手机的应用处理技术已经迁移到64 位,智能摄像头也开始转向采用64位处理技术,使得利用更先进功能的前沿应用也可以在智能视觉系统中无缝平滑实现。例如,在世界各地的智慧城市中,我们看到摄像头能够运行AI算法来检测人、宠物、包裹、车牌和其他物体。而且,随着摄像头本地算力的提升以及AI技术在智能摄像头中应用的不断扩展,智能视觉处理工作负载不仅有可能在摄像头内置的CPU以及日趋普遍的加速器上直接运行,而且这种边缘部署方式将越来越显示其优势,并有望成为主流。在这些技术发展的助力下,未来将有可能同时检测数百人或识别超速汽车的车牌,而无需再将大量数据传输到云端,影响处理的实时性。

 为什么采用64 位处理技术至关重要?

通过迁移至64位处理技术,可以更好地利用先进的64位CPU硬件与身俱来的更高性能和效率。最重要的是,64位CPU架构具有增强的寄存器支持和更大的内存映射。寄存器数量和宽度的增加意味着可以在减少内存访问次数的情况下处理更大的数据集,从而加快数据处理速度。更强的寄存器支持也意味着开发者可以利用先进的编译器优化技术,从而进一步提高性能。由于数据集在进出本地内存的交换会影响性能,因此,当提升的寄存器支持结合了64位架构带来的内存映射增加,软件就可以直接访问更多的本地数据进行处理,从而减少了对内存交换的需求。

随着智能摄像头的成像要求日益提高,低端摄像头和中高端摄像头分别开始采用4K、8K分辨率。从1080p 提升至4K意味着在相同的编码方案下,摄像头传入视频流的数据率翻倍。此外,为了更好地识别物体,帧率需要从15fps 增加到30fps 甚至60fps,对数据率和性能的需求也将相应地继续扩增。更高的帧率将使摄像头能够以更高的精度检测、识别和辨别更小的物体与快速移动的物体。从多个视频流进行同步4K 编码的需求,也对CPU性能提出了更高的要求。而这些都能很好地通过64 位处理器获得满足。

此外,为了满足成像和机器学习工作负载对于性能和带宽不断增长的需求,智能摄像头需要支持浮点运算。Armv8-A64 位架构将单精度的每周期FLOPS1性能提高了2 倍,双精度中提高了5 倍,从而改善了用户体验。

另外,从Armv8架构中的可收缩矢量扩展(ScalableVector Extension, SVE)和Armv9 架构中的SVE2 开始,Arm通过对Neon的扩展在成像和机器学习方面取得了进展,这一点也很重要。

图1:面向当前和未来智能摄像头的Arm64 位CPU

 提升机器学习性能

Arm64 位架构(称为AArch64)提供了更快、更大的内存访问,使机器学习模型能够更快地加载到内存。这种性能的提升可以加快执行来自智能摄像头的输入视频流的推理任务,从而更快地检测、识别和辨别图像中的物体。

为了充分利用视频编码器/解码器等片上加速器和处理器核心外部的机器学习硬件来实现高效的数据传输,必须优化内存带宽。提高系统内存流性能可以加快数据进出内存的速度,以供许多不同的硬件单元使用。图2显示了最常见的内存流基准,并展示了从32 位CPU 迁移到64 位CPU 时,性能可以提高3.75 倍。

图2:从Cortex-A7(32位)CPU迁移到Cortex-A35(64位)CPU时的内存流性能提升

 实现高级安全功能

64位ARMv8-A 架构在其CPU中提供了原生安全功能,其中加密指令AES、SHA和CRC 可以在软件加密的基础上提供3 至11倍的性能提升,可用于小粒度加密技术。随着Arm继续提高关键加密操作的性能,智能摄像头能够持续改进其加密算法,以支持物联网应用对隐私和安全的持续需求。

图3:从Cortex-A7(32位)CPU迁移到Cortex-A35(64位)CPU(带有加密扩展)时的加密性能提升

 对开发者的影响:软件和工具

与所有其他应用领域一样,软件和工具也将持续在智能摄像头领域发挥着重要作用,为广大的开发者持续创新提供动力,使新功能和应用源源不断地产生。随着对64 位Linux发行版的支持继续扩大,越来越多公司增加了对各种新功能的支持,如运行基于最新Arm 架构的容器调度器。

此外,Arm继续利用最新CPU 中的新功能来增强开源的GNU编译器工具链。Arm还增加了对领先的计算机视觉、图像处理和机器学习开源库OpenCV的支持,从而赋能更多的开发者能够轻松开发智能摄像头应用和产品。

 来自Arm和更广泛生态系统的支持

Arm将持续在最新的64位架构规格版本中提供与数字信号处理、矢量处理、机器学习和安全有关的增强功能,所有这些都是未来几代智能摄像头需要的关键计算处理能力。

在所有智能摄像头中采用基于64 位的Arm处理器有诸多益处,其中关键的是可以得到来自生态系统的广泛支持。例如,AWS已经通过其AWS Sagemaker Neo服务,在任何支持64 位Armv8-A的设备上增加了对机器学习推理的支持,使得那些计划使用AWS云服务进行机器学习部署的公司可从中受益。

ProjectCassini等生态系统计划解决了物联网部署的两个主要障碍:可扩展性和碎片化。对于芯片合作伙伴、ODM、OEM、ISV、系统集成商和开发者来说,ProjectCassini 通过加快在不同的Arm64 位平台上部署云原生应用,释放了边缘和物联网计算潜力。而要能充分利用Project Cassini 和SystemReady® 计划的优势,64 位的计算平台是必不可缺的要素。

为了加速边缘设备的开发和部署,Arm在2021年10月发布了Arm 物联网全面解决方案(ArmTotal Solutions for IoT),其产品路线图呈现了包括Arm虚拟硬件在内的全面解决方案的愿景,使客户能够在芯片流片前启动软件开发的工作。

 总结

如果您想要在智能摄像头生态系统中超越竞争对手,那么采用64 位处理技术至关重要。Arm乐于随时为开发者社区和合作伙伴提供支持,协助应对向64位处理技术过渡过程中的任何技术挑战。向64位迁移将会开创“双赢”局面。它将在性能、效率和安全方面为整个生态系统带来诸多裨益,并有助于摄像头满足未来的创新,进而改变我们的世界。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
TCND5000 1 Vishay Intertechnologies Photointerrupter Reflective Photodiode 4-Pin SMD T/R

ECAD模型

下载ECAD模型
$2.68 查看
MLX90360LGO-ACD-000-RE 1 Melexis Microelectronic Integrated Systems Hall Effect Sensor, -15-15mA, Rectangular, Surface Mount, ROHS COMPLIANT, TSSOP-16
暂无数据 查看
MS561101BA03-50 1 TE Connectivity (MS561101BA03-50) MS5611 BAROMETRIC SENSOR CM T&R

ECAD模型

下载ECAD模型
$10.49 查看
Arm

Arm

ARM公司是一家知识产权(IP)供应商,主要为国际上其他的电子公司提供高性能RISC处理器、外设和系统芯片技术授权。目前,ARM公司的处理器内核已经成为便携通讯、手持计算设备、多媒体数字消费品等方案的RISC标准。公司1990年11月由Acorn、Apple和VLSI合并而成。

ARM公司是一家知识产权(IP)供应商,主要为国际上其他的电子公司提供高性能RISC处理器、外设和系统芯片技术授权。目前,ARM公司的处理器内核已经成为便携通讯、手持计算设备、多媒体数字消费品等方案的RISC标准。公司1990年11月由Acorn、Apple和VLSI合并而成。收起

查看更多

相关推荐

电子产业图谱