• 正文
  • 相关推荐
申请入驻 产业图谱

【ATU Book- AI 系列】人工智能引领新潮流,AI芯片新战局

08/05 11:03
1586
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

核心技术优势/方案详细规格/产品实体图/PCB/方块图Datasheet/测试报告/Gerber/Schematics/User manual +一键获取

一、概述

随着 ChatGPT、Gemini 等大型语言模型的应用逐步融入我们的日常生活,AI 这两个字已经深深烙印在人们心中。因此,如何让人们的工作变得更智能、更高效、更快捷,成为下一个时代的重中之重!这也带动了云服务器对 GPU 使用需求的暴增。据 DIGITIMES 报道——『 AI 服务器需求激增,2024 年高端服务器 GPU 产值将达 1022 亿美元,NVIDIA 市场占有率居首。』。

另外,值得关注的另一个议题就是云端应用的孪生兄弟边缘计算(Edge Computing)该应用涵盖手机、相机、机器人、汽车、无人机、穿戴设备、工业与医疗电脑等,让每一台设备都赋予 AI 智能。相比需要通过互联网的云端计算,边缘计算强调计算速度、省电、低功耗、隐私性等概念。

对于对计算机视觉、机器学习深度学习有一定了解的人来说,会理解这两个领域实际上可以分为“训练”和“推理”。由于 GPU 的硬件设计非常适合应用于高重复性且复杂的任务,因此使用 GPU 来训练 AI 模型是非常合适的!当模型训练完成后,可以长时间利用该模型来实现各种预测任务,比如物体的位置、人脸特征是否匹配、下一段可能会说什么话等 AI 任务。因此,‘推理’应用市场是相当庞大的,并且会持续增长。句子: 。 具 Data Bridge – 『全球边缘人工智能 (AI) 硬件市场规模、份额和趋势分析报告 – 行业概览及 2032 年预测 』指出目前边缘人工智能(Edge AI)硬件市场规模为 18.6 亿美元,预计到 2032 年将达到 49.4 亿美元。

边缘计算市场预测 –出处 Data Bridge 网站

二、 AI 新浪潮的造势者

当前全球人工智能(AI)技术的飞速发展,正推动整个半导体产业迈向新的时代,而其中推理(Inference)所需要的算力(TOPS,Tera Operations Per Second)已成为衡量 AI 芯片性能最直观且重要的指标之一。这种需求不仅重塑了硬件的设计思维,更开启了一场全球性的 AI 芯片新战场!

新兴AI芯片公司百花齐放,推动NPU架构革新

在过去五年中,随着人工智能推理市场的兴起,越来越多的初创公司投入专用AI加速器的研发,特别针对低功耗、高性能的边缘设备需求,掀起了一场神经处理单元(NPU)架构的创新浪潮。以下为目前在国际间具有代表性的初创AI芯片公司:从2015年成立的 Kneron(台湾)2017年成立的 Hailo(以色列)2019年成立的 DeepX(韩国)、 MemryX(美国)、 Axelera AI(荷兰)与 Neuchips(台湾)到2025年为止,全球已有超过30家初创公司投入这一赛道,形成本世代少见的「百家争鸣局面,不仅从硬件架构创新着手,还扩展到软件生态系统整合、模型转换与工具链设计,形成完整的AI加速生态系统。

传统半导体巨头的快速反击

面对新兴AI芯片公司的崛起,过去在半导体市场占据主导地位的传统芯片巨头也加快步伐,积极转型以迎合AI推理与边缘计算的新趋势。这些企业拥有先进制程、完整的开发工具与全球供应链优势,正通过并购、产品整合与生态系统构建,重新布局AI硬件版图例如,Qualcomm 将 AI 引擎整合进 Snapdragon 平台,广泛应用于手机、车载装置;NXP 通过 i.MX 系列整合 NPU 与 eIQ 软件工具,瞄准工控与智慧城市;Renesas 则导入  Reality AI  用于 MCU/MPU 平台,强化传感与实时控制应用。同时,作为全球最大IP核心供应商的 ARM 也加入战局,推出 Ethos-U 系列 NPU,专为低功耗设备设计,与 Cortex-M / Cortex-A 处理器紧密集成。快速席卷可穿戴、家庭、IoT等边缘AI市场,如下图定义

ARM分析算力应用市场示意图 - 出处 ARM 和 linuxgizmos 网站

AI 芯片分流化时代:视觉与语言模型的双轴进化

随着AI推理需求快速增长,市场已明显分化为两大核心应用领域:计算机视觉(Computer Vision)与大型语言模型(Large Language Models, LLM)而各家AI芯片厂也根据不同需求设计对应的架构与产品策略。

计算机视觉领域,应用场景涵盖智慧交通、自动驾驶、安防监控、工业图像识别等,特别强调实时性、低延迟与低功耗。因此,大多数芯片设计采用中等级算力(10~50 TOPS)并优化数据迁移与模型部署效率,例如:DEEPX DX-M1(25 TOPS)、Hailo-8(26 TOPS)、MemryX MX3(24 TOPS)等。此外,例如 SiMa.ai MLSoC(50 TOPS)与 Axelera AI Metis(214 TOPS)等高性能产品,也可支持多模型并行或高分辨率视觉分析的需求。

相比之下,大型语言模型如 ChatGPT、BERT、LLaMA 等,则需要极高的计算吞吐量与参数处理能力,这驱动了 AI 芯片朝向高 TOPS、高带宽与大量内部存储的方向发展。例如:Tenstorrent Wormhole n300d 的推理性能达到 466 TOPS 与 Neuchips RecAccel N3000(206 TOPS)针对数据中心与云端部署优化,专为边缘部署设计的产品。更小一些的边缘设备,如 DEEPX DX-M2(40 TOPS)、Hailo-10H(40 TOPS),已经具备支持轻量版 LLM 推理的能力。

如下图,不仅突显各家芯片产品的技术定位,也说明 AI 硬件市场正快速朝着应用分层与场景化设计的趋势迈进。评估AI芯片供应商的优劣,不仅仅只是以算力(TOPS)作为唯一衡量指标必须考虑功耗、延迟时间以及实际软件部署体验。用户将会从中找到最适合的 NPU 解决方案。这场 AI 芯片竞赛不仅是拼性能,更是系统整合与应用落地能力的全面较量

AI 芯片市场布局示意图(信息与 Logo 摘自公开网站,仅供对照参考)

大大通

大大通

针对电子行业逐渐呈现碎片化、客制化的趋势,大联大推出汇聚内外工程师,搭建互相帮助乐于分享,解决问题的首选技术平台----研发心中的翰林院 大大通。其中包含了大联大代理的上百条产品线、数百个方案,以及最新的产品信息和原厂新闻。大大通的方案涵盖智能家居、智慧城市、穿戴装置、智慧医疗、车联网、电源等应用领域;除了大联大内部的方案,还有原厂的最新方案,以及行业优质合作方案商(IDH)的方案,打通客户、原厂、IDH 以及大联大的FAE 之间的壁垒,搭建整个技术的生态圈。 除了大联大七百馀位专业FAE在线上进行高效、专业的技术支持,大大通更希望汇聚所有工程师一起分享和成长。客户可以更直接快速的了解方案、解答疑问、获取技术文档,从而缩短客户方案量产时间。使用者登录后,可以根据应用、原厂、传输技术、输出功率等选项快速筛选出感兴趣的方案;浏览方案时可以提问、分享、收藏,还能一键连结到大大购进行方案的关键物料的购买。大大通还有完善个人的社交系统,关注技术大牛,获取积分,吸引粉丝,获取更高头衔和特别勋章,让工程师可以获得荣誉感、成就感。

针对电子行业逐渐呈现碎片化、客制化的趋势,大联大推出汇聚内外工程师,搭建互相帮助乐于分享,解决问题的首选技术平台----研发心中的翰林院 大大通。其中包含了大联大代理的上百条产品线、数百个方案,以及最新的产品信息和原厂新闻。大大通的方案涵盖智能家居、智慧城市、穿戴装置、智慧医疗、车联网、电源等应用领域;除了大联大内部的方案,还有原厂的最新方案,以及行业优质合作方案商(IDH)的方案,打通客户、原厂、IDH 以及大联大的FAE 之间的壁垒,搭建整个技术的生态圈。 除了大联大七百馀位专业FAE在线上进行高效、专业的技术支持,大大通更希望汇聚所有工程师一起分享和成长。客户可以更直接快速的了解方案、解答疑问、获取技术文档,从而缩短客户方案量产时间。使用者登录后,可以根据应用、原厂、传输技术、输出功率等选项快速筛选出感兴趣的方案;浏览方案时可以提问、分享、收藏,还能一键连结到大大购进行方案的关键物料的购买。大大通还有完善个人的社交系统,关注技术大牛,获取积分,吸引粉丝,获取更高头衔和特别勋章,让工程师可以获得荣誉感、成就感。收起

查看更多

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

大大通的方案涵盖智能家居、智慧城市、穿戴装置、智慧医疗、车联网、电源等应用领域;除了大联大内部的方案,还有原厂的最新方案,以及行业优质合作方案商(IDH)的方案,打通客户、原厂、IDH 以及大联大的FAE 之间的壁垒,搭建整个技术的生态圈。 除了大联大七百馀位专业FAE在线上进行高效、专业的技术支持,大大通更希望汇聚所有工程师一起分享和成长。客户可以更直接快速的了解方案、解答疑问、获取技术文档,从而缩短客户方案量产时间。