随着物联网、云计算、人工智能等新兴产业的崛起,嵌入式技术的应用越来越广泛,迎来发展的大好时机。据统计,中国的嵌入式市场规模已超过 500 多亿元,预计未来三年中国嵌入式软件产业的增长率将高达 40%左右。在企业级 SSD、家庭网络、无线控制和智能家电等领域中,相关产品对性能、面积、功耗和成本都提出更高要求,嵌入式技术也要随之改进。为了进一步提高嵌入式系统的性能,Synopsys 推出适合高性能嵌入式应用使用的新 DesignWare ARC HS4x 和 HS4xD 处理器系列。
据 Synopsys ARC 处理器高级产品营销经理 Michael Thompson 介绍,“这两个系列包含 5 个处理器产品:ARC HS44、HS46、HS48、HS45D 和 HS47D 处理器,具有单核、双核和四核配置,实施了双发射超标量架构,最高速度为每个内核 6000 DMIPS,提供 2 倍的性能和独特的高性能控制和高效数字信号处理组合。其中,HS4X 产品只执行 RISC 架构,HS4XD 产品执行 RISC+DSP 架构,增加了 150 多个优化的 DSP 指令,向下兼容广泛应用的 ARC EMxD 内核。”
解决嵌入式系统面临的诸多挑战
嵌入式系统越来越复杂,同时要求产品小面积、低能耗、低成本,这使开发者面临巨大的挑战。如何做到不增加时钟频率和内存器访问时间?Michael Thompson 指出,“Synopsys 从三方面采取措施:第一,增加每个时钟周期指令执行数量,比如将每个时钟周期执行指令条数从一个增加到两个,在并行双事件管道中执行多条指令;增加内存访问时间;支持多核执行等。第二,为固定或下降的嵌入式应用管理功耗预算,不只依靠芯片性能更关注性能效率,增加功耗管理,减少浪费。第三,更有效地移动数据,32 位的处理器支持数据移动 64 位进行,对处理器配置性能翻倍的 DMA。第四,在一个处理器中实现 RISC 和 DSP 的高性能组合,软件工具和库无缝支持 C/C++编程和调试。”
“双重架构的优势在于,增加功能单元的利用率,增加额外的硬件数量;每个时钟周期可以执行提升到执行两个指令,增加了 RISC 和 DSP 两种性能,面积和功耗增加 15%;支持指令的并行执行;编译器执行双重架构。” Michael Thompson 补充。
HS4X 系列 /HS4xD 系列:适用于高端嵌入式应用
ARC HS4X 系列处理器采用了 ARCv2 指令集架构(ISA),可实现低功耗、小体积硅封装的高性能嵌入式设计。ARC HS4x 系列具有高速 10 级双发射流水线,支持乱序执行,从而尽可能减少了处理器的空闲周期,尽可能增加了指令吞吐量。在典型的 16-nm FinFET 制程中,处理器可在 2.5 GHz 下,提供高达每个内核 6000 DMIPS 的性能,同时仅需要 0.06 mm2 面积且功率低至 37 microwatts/MHz。HS4X 系列的目标应用是固态硬盘(SSD)、无线基带、无线控制和家用网络。
HS4xD 系列具有和 HS4x 一样的高端控制功能,还有对基带、音频、声音、语音和其他信号处理应用有用的额外 DSP 功能。为了加速数学函数的执行,HS45D 和 HS47D 为设计人员提供了实施硬件整数分频器这一选项以及适用于 64 位乘积、乘积累加(MAC)、向量加减和可配置 IEEE 754 兼容浮点单元(单精度、双精度或两种精度)的指令。HS4xD 处理器中高性能 RISC 和 DSP 功能的混合提供了高效的多信道音频处理功能,适合手机应用、家庭应用和车载信息娱乐系统应用。HS4xD 可同步管理通信栈、文件系统支持等控制任务,同时还能提供信号处理带宽,支持音频解码、后期处理和基于语音的人机接口(HMI)处理。
Michael Thompson 指出,“从性能上对比,HS4X 系列 /HS4xD 系列处理器相对于 Cortex-A9 处理器性能提升 45%,功耗减半;相对于 MIPS InterAptiv 或者 Cortex-A7 处理器性能翻倍,功耗降低 20%;相对于 Cadence Tensilica 处理器性能提升 2.5 倍。”
MetaWare 开发工具包简化了 HS4x/HS4xD 处理器编程
ARC HS4x 和 HS4xD 处理器系列拥有一个稳固的软硬件开发工具生态系统支持,其中包括 MetaWare 编译器 / 调试器、nSIM 指令集模拟器、MQX 实时操作系统(RTOS)和行业领军供应商提供的第三方工具、操作系统(包括 Linux)和中间件。MetaWare 开发工具包包括优化的 DSP 函数库,如 FFT 和 DCT、FIR 和 IIR 滤波器,以及向量和矩阵数据函数,允许软件设计人员从标准 DSP 构建块快速实施算法。该工具还包含开发语音代码使用的基于 ITU-T 的运行库。对于常规 C 代码,编译器能自动生成 ARCv2DSP ISA 指令,以提供最佳性能,包括引导的和自动的向量化优化。
在嵌入式应用中创新不断,嵌入式产品复杂度越来越高的发展背景下,新的 ARC HS4x 和 HS4xD 处理器是 ARC 资产组合中性能最高的处理器,支持设计人员满足嵌入式设计所需的日益增长的控制和信号处理需求,在嵌入式领域会发挥越来越重要的作用。
与非网原创报道,未经允许,不得转载!
更多相关内容,请参照:与非网 Synopsys 专区。