加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

骁龙855/麒麟980/苹果A12/联发科P60/瑞芯微RK3399,谁能领跑AI时代?

2018/12/14
1250
阅读需 33 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

 

2018 年,AI 几乎充斥了我们的生活,如果见朋友不聊点和 AI 相关的话题,似乎自己就与这个时代脱节了,近期高通骁龙 855 的发布再次把 AI 的关注度推向了高潮,从权威统计机构的预测来看,2018 年全球 AI 市场规模预计为 1.2 万亿美元,到 2022 年有望达到 3.9 万亿美元。AI 势不可挡的发展势头让各大科技公司不得不一拥而上,不管是做芯片还是做产品,统统都要和 AI 挂钩,大有“得 AI 者得天下”之势。AI 已经在各个领域开始渗透,光 AI 音箱这一种亚马逊、天猫、小米就打得不可开交,其它智能电子产品更是不胜枚举,当然,这都不是今天的重点,今天我主要想谈的是 AI 芯片,今年推出的这些 AI 芯片看看哪些比较靠谱。

目前,笔者知晓的 AI 芯片有骁龙 855、麒麟 980、苹果 A12、联发科 P60、紫光展锐 SC9863A 和瑞芯微 RK3399Pro,谁强谁弱先拉出来比一比:

1、骁龙 855:张量加速器不等于独立 NPU
骁龙 855 采用台积电 7nm 工艺制程,CPU 为 Kryo485(超级内核基于 A76 定制主频 2.84GHz、性能内核主频 2.42GHz、效率内核主频 1.8GHz,1+3+4 架构);GPU 为 Adreno640,与前代产品相比,渲染速度提升 20%,支持 Vulkan1.1/HDR/PBR。


骁龙 855

在 AI 性能方面,骁龙 855 加入新的张量加速器(TensorAccelerator),专门负责 AI,组成第四代 AI 引擎。可以实现每秒超过 7 万亿次运算(7TOPs),AI 性能比骁龙 845 提高了 3 倍,比苹果 A12 每秒 5 万亿次运算(5TOPs)也高出不少。
 
高通的 DSP 数字信号处理器升级为最新的 Hexagon690,具备四线程标量内核,性能提升 20%,四个向量扩展核心(HVX),性能提升 1 倍,另外一个重要的改进是引入了张量加速器(HTA),自主设计,专为 AI 而设,支持多元数学运算、非线性方程、INT16/INT8 与混合精度整数运算,大幅提升了机器学习算法的性能和能效。结合 HexagonDSP、新的张量加速器,再借助更强的 GPU 和 CPU 完成终端侧神经网络运算,所有单元综合实现了专有的、可编程的 AI 加速。

但是,值得注意的是,骁龙 855 并没有配置独立 NPU 单元,其 AI 运算需要协调 CPU、DSP、GPU 等处理器单元,如果应用场景复杂,恰巧占用了这些处理单元,AI 运算就要排队等候。也就是,其他公司的芯片的人工智能算力是独立算力,高通的 AI 运算是综合算力。

2、麒麟 980: 配置双 NPU
麒麟 980 采用 7nm 工艺制程,基于 ARM 的 A76 架构,主频是 2.6GHz,八核心分别是 2×A76(超大核)+2×A76(大核)+4×A55(小核),其中 A76 四个核心上采用了智能调度机制。相对于传统的大小核两档位设计,麒麟 980 让 CPU 在重载、中载、轻载场景下灵活适配。

在 AI 配置上,麒麟 970 搭载了一个 NPU(神经处理单元),其专门负责 AI 运算,在大幅提高手机 AI 性能的同时降低了 AI 任务功耗。麒麟 980 则配置了两个 NPU,因此在 ResNet-50 图像识别测试中得到了 4500 张每分钟的成绩。整体来看,相较于麒麟 970,麒麟 980 的 CPU 性能提升 75%,能效提升 58%,内置的 10 核 GPU Mali-G76 让性能密度号称提升 30%,能效提升 30%。

3、苹果 A12:搭载 8 核神经网络引擎
A12 采用 7nm 技术,内部有 69 亿个晶体管,采用六核 CPU 设计,相比 A11 处理器,其中两个大核心性能提速 15%、功耗降低了 40%,四个小核心功耗降低最多 50%。A12 采用自研四核 GPU,性能相比 A11 的 GPU 性能提高 50%,并强化了对 AR 混合现实的支持,支持曲面细分、无损内存压缩和实时多层渲染功能,AR 性能获得大幅度提升。

关于 AI 性能,苹果 A12 还搭载了八核神经网络引擎,其运算速度达每秒 5 万亿次,远超 A11 的每秒六千万次,可以更独立机器学习,支持多精度,智能计算系统。同时,苹果还将神经网络引擎开放给 Core ML 平台,开发者可将机器学习技术应用到自己的 app 中,让学习过程在用户的 iPhone 上进行。提升了 Siri 易用性、使 A12 芯片的机器学习能力相比之前能够提升 9 倍,而能耗则降低到原来的十分之一。

4、联发科 Helio P60
联发科 Helio P60 采用 ARM Cortex A73 和 A53 大小核架构,采用八核心大小核(big.LITTLE)架构,内建四颗 ARM A73 2.0 Ghz 处理器与四颗 ARM A53 2.0 Ghz 处理器。相较于上一代产品 P23 与 P30,CPU 及 GPU 性能均提升 70%。采用 12nm FinFET 制程工艺,功耗表现得到很大提升,整体效能提升 12%,执行大型游戏时的功耗降低 25%,大幅延长手机电池的使用时间。

关于 AI 配置,联发科在 P60 中引入了 AI 单元 APU,在 P60 中采用了三核 ISP+双核 APU 的架构,性能提升两倍。ISP+APU 的多核图像处理单元除了提供硬件加速之外,还能够提供多线程的处理能力,这使得对于图片处理能力和速度大幅提升。包括自动对焦、白平衡以及高规格 HDR 在内等反映的速度更快。此外,APU 的引入以及联发科提供的平台化的策略,也更有利于开放给合作伙伴以及第三方进行拍照的后处理,定制更多的拍照算法。应该说 AI 的引入,使得 P60 的硬件性能进一步得到释放。与此同时,AI 所带来的软件层面的超级算力也将带来诸如人脸、语音识别等功能的进一步增强。

 

5、紫光展锐 SC9863
紫光展锐 SC9863 主打 AI 牌,被称为 8 核 AI 芯片,支持 CAT-7,采用 Arm Cortex-A55 处理器架构的 SoC 芯片平台,在 Cortex-A55 人工智能的基础上,进行了应用开发。Cortex-A75 与 Cortex-A55 均采用 Arm DynamlQ 技术打造,而 DynamlQ 融入了 AI 神经网络技术。相比前代 Cortex-A53,Cortex-A55 NEON 进行了流水线改进与新增机器学习指令,让其在矩阵乘法运算方面的机器学习性能大幅提升,如果按照 AI 8bit dot-product 运算能力,比 Cortex-A53 提升 6 倍。

同时,得益于 ARM DynamlQ 单簇组合方式,Cortex-A75 与 Cortex-A55 可实现 1+3、1+7 或者 4 个大核、8 个小核的组合,多个 CPU 核芯以单簇的方式一起工作,可发挥更强大的性能,避免“1 核有难,7 核围观”的状况。紫光展锐 SC9863 采用的是 8 核 Cortex-A55 的组合方式,而高通骁龙 845 是 4 核 Cortex-A75 与 4 核 Cortex-A55 的组合方式。

SC9863 芯片平台的 AI 能力体现在支持基于深度神经网络的人脸识别技术,可实现快速精准的人脸认证;通过智能 AI 算法,实现实时智能场景检测识别、不同场景智能拍照增强、支持手机侧图库照片的智能识别与分类。但是,没有加入独立的神经处理单元,计算能力是否会出现折扣不得而知。

6、瑞芯微 RK3399
RK3399Pro 采用 big.LITTLE 大小核 CPU 架构,双核 Cortex-A72+四核 Cortex-A53+四核 ARM 高端 GPU Mali-T860,其集成的 NPU(神经网络处理器)融合了 Rockchip 在机器视觉、语音处理、深度学习等领域的多年经验。相较传统芯片,典型深度神经网络 Inception V3、ResNet34、VGG16 等模型在 RK3399Pro 芯片上的运行效果表现出众。

RK3399Pro 的 AI 特性有三点:
1)AI 硬件性能高,采用专有 AI 硬件设计,NPU 运算性能高达 2.4TOPs,高性能与低功耗指标均大幅领先:相较同类 NPU 芯片性能领先 150%;相较 GPU 作为 AI 运算单元的大型芯片方案,功耗不到其所需的 1%;
2)平台兼容性,RK3399Pro 的 NPU 支持 8bit 与 16bit 运算,能够兼容各类 AI 软件框架。现有 AI 接口支持 OpenVX 及 TensorFlowLite/AndroidNN API,AI 软件工具支持对 Caffe/TensorFlow 模型的导入及映射、优化;
3)完整方案易于开发,Rockchip 基于 RK3399Pro 芯片提供一站式 AI 解决方案,包括硬件参考设计及软件 SDK,可大幅提高全球开发者的 AI 产品研发速度,并极大缩短产品上市时间。

从以上六款带有 AI 功能的芯片来看,在架构上基本都是采用了多核模式,以八核为主;另外,关于 AI 运算,在原有 CPU、GPU 的基础上增加独立神经元计算处理单元成为主流趋势,这样可以实现 AI 运算加速,从而带来更好的用户体验;在应用方面,还是以手机的人脸识别、图像处理为主,未来随着 5G 的商用,在自动驾驶汽车中的应用也会逐渐增加。

从对比中可以看出,国产厂商和国内厂商各占一半,从高端到低端均有覆盖,在独立神经元计算单元的集成上,只有海思、苹果、联发科的产品上已经实现,其它几家厂商还在追赶。由于智能手机强烈的市场需求,因此 AI 普及起来更为顺畅,但是目前需要在人脸识别和图像处理的基础上探索更多可能的应用。

与非网原创内容,未经允许,不得转载!

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
PIC32MX795F512L-80I/PT 1 Microchip Technology Inc 32-BIT, FLASH, 80 MHz, RISC MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100

ECAD模型

下载ECAD模型
$9.74 查看
MCIMX535DVV1C 1 Freescale Semiconductor i.MX53 32-bit MPU, ARM Cortex-A8 core, 1GHz, PBGA 529
$36.91 查看
MC9S12A128CPVE 1 Rochester Electronics LLC 16-BIT, FLASH, 25MHz, MICROCONTROLLER, PQFP112, LEAD FREE, LQFP-112
$22.47 查看
高通

高通

我们通常每天冒出数十亿、甚至可能是万亿次的不可能的念头。 这个频率就是世界各地的人们接触 Qualcomm 产品的频率。 这些产品可以是装入口袋的智能手机、咖啡桌上的平板电脑、手提箱里的无线调制解调器,甚至是您汽车上的导航系统,或者捆绑在您胸前的运动摄像头。

我们通常每天冒出数十亿、甚至可能是万亿次的不可能的念头。 这个频率就是世界各地的人们接触 Qualcomm 产品的频率。 这些产品可以是装入口袋的智能手机、咖啡桌上的平板电脑、手提箱里的无线调制解调器,甚至是您汽车上的导航系统,或者捆绑在您胸前的运动摄像头。收起

查看更多

相关推荐

电子产业图谱