加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

爱芯元智入选2024玄铁优选伙伴:发展AI计算,携手RISC-V重塑千行百业

03/18 17:44
1204
阅读需 6 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

人工智能芯片研发及基础算力平台公司爱芯元智宣布,以“开放·连接”为主题的第二届玄铁RISC-V生态大会于03月14日在深圳举行,爱芯元智联合创始人、副总裁刘建伟受邀发表主题演讲,向与会嘉宾分享了爱芯通元混合精度NPU这一面向边端侧算力布局的AI处理器,以及基于RISC-V生态所进行的AI算力提升及行业落地探索。

同时,大会还公布了“玄铁优选伙伴”,爱芯元智等8家公司入选。据悉,该项荣誉旨在推动玄铁生态成果落地,连接RISC-V产业链生态网络,促进玄铁商业生态发展。此次入选,代表着爱芯元智对玄铁RISC-V生态做出的贡献得到肯定。

AI无处不在,RISC-V为AI计算添动力

从以ChatGPT为代表的云端大模型,到边缘侧的计算盒子和散布于端侧的各个摄像头,伴随着技术的快速发展,AI已经无处不在。智能驾驶智能机器人、智慧工厂、智慧城市、智能零售等多个端侧业务场景下,AI都开始发挥作用,为各行各业带来了生产力的提升。

作为支持边缘侧和端侧智能的平台型芯片公司,爱芯元智以“普惠AI 造就美好生活”作为企业使命,专注于高性能、低功耗的人工智能视觉处理器芯片研发。刘建伟介绍,爱芯元智的系列芯片产品已在AIoTADAS两大产品线得到广泛应用并实现稳健发展,推动AI在边缘侧和端侧的部署落地。

但AI在边端侧的落地,也意味着更高的算力需求。对此,精简、灵活、高效的RISC-V指令集架构展现出了其优势,有望成为万物互联时代核心处理器的架构之一。作为本次玄铁优选伙伴,爱芯元智也在现场分享了基于玄铁RISC-V所进行的行业落地实践,如面向物联网领域,爱芯元智通过应用玄铁RISC-V处理器,并结合爱芯智眸AI-ISP和爱芯通元混合精度NPU两大自研核心技术,实现了快速低功耗AI检测唤醒,可大大降低系统耗电,轻松应对电池类产品需求。

同时,爱芯元智还通过爱芯通元混合精度NPU与玄铁RISC-V IP的结合,打造出高能效AI计算平台,实现了图形分割、以文搜图等大算力应用,满足边端不同场景下对感知、计算和数据处理能力的需求。

打造原生AI处理器,携手玄铁RISC-V重塑千行百业

算力是AI的基础,那么AI时代,我们究竟需要什么样的算力基建?

刘建伟指出,当下,AI程序的计算密度变得更高,呼唤着NPU这一新的处理器出现,“作为AI专用处理器,NPU应该有自己的指令集,而不是被简单理解为加速器或是扩展指令集。”其表示,在AI计算中,指令操作的对象变成了高维的张量,因此整个处理器的能耗需要放在数据计算上,且降低数据搬运和整理组合的能耗。而从推理的角度来看,大部分AI的算法/算子已处于收敛状态。因此,以算子这一AI模型的基本运算单元为指令集进行NPU设计,可以打开硬件微架构设计空间,从而有更多的设计思路可以使用,提高能效比。

而作为爱芯元智自研核心技术,爱芯通元混合精度NPU即是以算子为原子指令集的AI计算处理器,其采用多线程异构多核设计,实现算子、网络微结构、数据流和内存访问优化,高效支持混合精度算法设计,原生支持Transformer网络结构,为大模型在边缘侧、端侧的应用提供了良好的基础。

同时,爱芯通元混合精度NPU还提供成熟易用的编译器,从而大幅度降低AI软件的开发、部署成本,助力客户在一小时内快速上手,推动AI计算的蓬勃发展。

从AI处理器在视觉领域的评价指标来看,爱芯通元混合精度NPU也表现出色,其在运行SwinT时,量化精度达到了高于市面平均水平的80.45%,并有着416 FPS的高性能和199FPS/W的低功耗。

为满足多样化的AI计算需求,作为AI处理器的NPU还需要更加灵活的动态控制,这也正是爱芯元智与玄铁RISC-V展开深度合作的原因。据介绍,爱芯元智正在探索基于玄铁RISC-V主控和爱芯通元混合精度NPU,打造生成式AI解决方案。“我们希望携手玄铁RISC-V打造AI硬件的最优平台选择,把AI落到千行百业,助力更多客户提升效率,创造价值。”刘建伟表示。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
MKL02Z32CAF4R 1 Freescale Semiconductor Kinetis L 32-bit MCU, ARM Cortex-M0+ core, 32KB Flash, 48MHz, WL-CSP 20

ECAD模型

下载ECAD模型
$2.7 查看
STM32F745IGT6 1 STMicroelectronics High-performance and DSP with FPU, Arm Cortex-M7 MCU with 1 Mbyte of Flash memory, 216 MHz CPU, Art Accelerator, L1 cache, SDRAM

ECAD模型

下载ECAD模型
$16.29 查看
ATXMEGA128A1U-AU 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 100TQFP

ECAD模型

下载ECAD模型
$7 查看

相关推荐

电子产业图谱