
随着AI渗透至每一个终端,每一个机器,每一个人的生活,AI不再是“中心计算”的专属特权,而将成为一个社会级智能系统的组成部分。要实现这一愿景,关键在于是否有足够便宜、足够高效、足够灵活的“算力基建”。
2025年5月,在第十五届松山湖中国IC创新高峰论坛现场,围绕AI基础设施与边缘计算展开的技术分享接连登场。

爱芯元智联合创始人、副总裁刘建伟
爱芯元智联合创始人、副总裁刘建伟介绍了边缘AI芯片AX8850的技术架构与实际应用,更从底层计算逻辑出发,重新定义了AI处理器在“普惠AI”时代的角色。通过AX8850这类产品,爱芯元智正试图打通AI应用最后一公里,推动从“能用AI”到“用得起AI”的产业跃迁。
AI正成为基础设施
不同于前几年将算力集中在云端、交互局限于“文字与语音”的形式,如今AI开始嵌入摄像头、机器人、无人设备,完成从“认知到执行”的具身转化。AI开始成为一种“有形的基础设施”,其普及程度与用水、用电的公共资源相提并论。
“我们希望把算力做得更经济,真正实现‘普惠AI’,让智能变得更加可及。”在刘建伟看来,AI本质上正在成为一种稳定可靠的智能输出基建。它的作用是将物理世界数字化——但不同于传统意义上对数值和符号的采集,AI能对视频、图像、行为、空间结构等进行高维度的理解和重构,从而让终端实现更深层次的自动化与智能协同。
他指出,这种智能输出基础设施的核心驱动力,并不是算法的花哨程度,而是算力的成本与能效比。只有当“1元钱”的算力能跑出足够多的推理量,才能真正让AI走向“水电化”部署的可能。
AI是一种新的“程序范式”

在传统计算架构中,程序是由开发者制定规则,依靠流程与逻辑来推动的。然而AI程序不同,它是数据驱动的。开发者只需设计好网络结构,模型的行为和性能则由数据训练来决定。这种范式的改变,对底层算力提出了完全不同的要求。

刘建伟系统地分析了AI程序的两个底层逻辑:
以Tensor为核心的计算模型:AI程序的最小计算单位不再是标量或低维向量,而是高维Tensor,常见于卷积、归一化、注意力机制等神经网络结构中。这些数据结构往往是千维、万维,导致计算密度呈指数级增长。
数据驱动的连续流处理:AI并不适合传统CPU所擅长的跳转密集型任务,而更适配于类似图形渲染的数据流处理模式。这种特点也促使GPU在AI早期阶段成为主流推理平台。
但GPU并不是AI应用的终点。它的通用性在云端足够强大,但在边缘部署中往往存在成本高、功耗大、体积受限等情况。于是,为AI而生的NPU(神经网络处理器)应运而生。
AX8850正是爱芯元智在这一背景下,结合多年量产打磨的自研核心技术 AI-ISP与混合精度NPU,推出的旗舰级边缘AI SoC产品。
10倍能效比提升,AX8850的“性价比”优势
AX8850并不是追求单纯的“峰值性能”或者“参数堆叠”,而是针对边缘部署需求,在架构、指令集、内存访问方式等多个维度进行“算力性价比”的极致优化。
其架构采用了基于算子指令集的数据流微架构设计。在AI语义中,“算子”如同神经网络的基本构件(Conv、LayerNorm、Attention等),AX8850直接将这些算子作为硬件调度的执行单元。相比通用CPU通过汇编指令控制每一条数据路径的处理方式,这种“以算子为中心”的架构更贴合AI程序的运行模式。
其次,AX8850采用异构多核、多线程处理架构,可根据任务类型自动调用CNN、BEV、Transformer等不同模型结构。同时,原生支持DeepSeek、Qwen、LLaMA等主流轻量化大模型,并内嵌量化与剪枝优化算法,确保大模型在边缘侧流畅运行。

最重要的是能效比的提升——AX8850相较于同等GPU方案实现了约10倍的能效比优势。这意味着,原来需要通过高性能GPU完成的AI任务,如今在一块成本更低、体积更小的芯片上也能轻松运行。
AX8850的强大算力并非停留在实验室,其真正价值在于为边缘AI提供可落地的“智价比基建”。
在此次论坛中,刘建伟展示了多个AX8850的真实应用场景:
语义感知与图生文生成:芯片可实时理解视频画面中的人物行为,并结合语音或文本输入生成描述性内容,实现“环境理解+语义表达”的闭环。例如,识别“穿红衣服的人走进房间”并自动生成对应提示;
多轮对话与机器人情绪表达:AX8850可嵌入人机交互系统中,实现多轮对话控制,同时根据语境生成图像反馈,表达情绪状态或控制机器执行动作——这是“人机交互+行动执行”的典型具身智能场景;
视频级联感知与事件判断:在智慧城市、智能家居、看护等领域,AX8850支持连续视频帧的深度分析,如跌倒检测、异常行为判断等,通过时间线索提升感知准确性;
多摄像头与毫米波融合感知:支持多视角摄像头融合构建三维感知,还能接入4D毫米波雷达数据,在视觉受限场景下补全目标检测信息,提高感知鲁棒性;
DeepSeek类大模型边缘部署:可在低功耗条件下运行Transformer类大模型,适配扫地机器人、巡检无人机、车载娱乐等场景中的AI助手。
这些案例共同指向一个趋势——边缘AI不再只是图像识别和简单推理,而正在迈向“认知+执行”的高阶智能阶段。
AX8850的软件工具生态链

AI处理器的价值,不仅取决于芯片的硬件性能,还高度依赖其软件生态的配合程度。刘建伟在演讲中也明确指出,爱芯元智在软件工具链上的投入已持续多年,涵盖模型转换、编译优化、运行时调度、硬件加速等全流程。AX8850支持主流深度学习框架(如PyTorch、TensorFlow等),并提供适配自家NPU的优化编译器,方便开发者一键部署模型。同时在推理引擎层面,支持动态调度、数据流图优化、精度感知执行等关键功能,确保模型运行时达到最佳功耗与响应速度平衡。更重要的是,软件栈通过持续升级,保证了芯片与前沿AI算法的同步发展,为未来应用场景预留扩展空间。
来源: 与非网,作者: 李坚,原文链接: https://www.eefocus.com/article/1839038.html
5145