加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 英伟达专注的 GPU 优势逐渐缩小
    • 利用 AI 计算打侧面竞争战
    • 两种芯片势能英伟达与 Graphcore 的较量
    • AI 计算未来有三种计算平台
    • 构建生态链条 IPU 仍在路上
    • 结尾:
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

趋势丨向AI求生的路上,GPU已上岸,IPU在崛起

2020/10/19
335
阅读需 8 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

AI 近些年的大火,直接促进了 CPU 和 GPU 的发展,而英伟达的 GPU 真正借此迅速成为 AI 市场的主流产品之一,其势头甚至盖过了 CPU。

而 AI 应用需要专门的处理器,而 IPU 正是这样的处理器。目前,AI 在各行各业均得到广泛应用,IPU 可以基于自身优势为世界的智能化进程增添不竭动力。

英伟达专注的 GPU 优势逐渐缩小

从专注图像渲染崛起的英伟达的 GPU,走的也是相当于 ASIC 的技术路线,但随着游戏、视频渲染以及 AI 加速需要的出现,英伟达的 GPU 也在向着 GPGPU 的方向演进。

硬件更多的需要与软件生态挂钩时,市场大多数参与者便会倒下。在竞争清理过后,GPU 形成了如今的双寡头市场,并且步入相当成熟的阶段。

ASIC 本身的成本、灵活性缺失,以及应用范围很窄的特点,都导致它无法采用最先进制程:即便它们具备性能和能效优势,一旦无法采用最先进制程,则这一优势也将不再明显。 

为保持其在 GPU 领域的寡头地位,使得英伟达必须一直保持先进的制程工艺,保持其通用性,但是要牺牲一定的效能优势。

相比于来自类 GPU 的竞争,英伟达不应该忽视 Graphcore 的 IPU,特别是 Graphcore 一直都在强调其是为 AI 而生,面向的应用也是 CPU、GPU 不那么擅长的 AI 应用。

利用 AI 计算打侧面竞争战

不管 CPU 还是 GPU 都无法从根本上解决 AI 问题,因为 AI 是一个面向计算图的任务、与 CPU 的标量计算和 GPU 的矢量计算区别很大。

而另一边的 IPU,则为 AI 计算提供了全新的技术架构,同时将训练和推理合二为一,兼具处理二者工作的能力。

作为标准的神经网络处理芯片,IPU 可以支持多种神经网络模型,因其具备数以千计到数百万计的顶点数量,远远超过 GPU 的顶点规模,可以进行更高潜力的并行计算工作。

计算加上数据的突破可以让 IPU 在原生稀疏计算中展现出领先 IPU 10-50 倍的性能优势,到了数据稀疏以及动态稀疏时,IPU 就有了比 GPU 越来越显著的优势。

此外,如果是在 IPU 更擅长的分组卷积内核中,组维度越少,IPU 的性能优势越明显,总体而言,有 4-100 倍的吞吐量提升。

5G 网络切片和资源管理中需要用到的强化学习,用 IPU 训练吞吐量也能够提升最多 13 倍。

两种芯片势能英伟达与 Graphcore 的较量

Graphcore 成立于 2016 年,是一家专注于机器智能、同时也代表着全新计算负载的芯片制造公司,其包括 IPU 在内的产品研发擅长大规模并行计算、稀疏的数据结构、低精度计算、数据参数复用以及静态图结构。

英伟达的潜在竞争对手 Graphcore 的第二代 IPU 在多个主流模型上的表现优于 A100 GPU,两者将在超大规模数据中心正面竞争。

未来,IPU 可能在一些新兴的 AI 应用中展现出更大的优势。

 

第二代 IPU 相比第一代 IPU 有两倍峰值算力的提升,在典型的 CV 还有 NLP 的模型中,第二代 IPU 相比第一代 IPU 则展现出了平均 8 倍的性能提升。

如果对比英伟达基于 8 个最新 A100 GPU 的 DGX-A100,Graphcore 8 个 M2000 组成的系统的 FP32 算力是 DGX-A100 的 12 倍,AI 计算是 3 倍,AI 存储是 10 倍。

AI 计算未来有三种计算平台

第一种平台是 CPU,它还会持续存在,因为一些业务在 CPU 上的表现依然不错;

第二种平台是 GPU,它还会持续发展,会有适合 GPU 的应用场景。

第三种平台是就是 Graphcore 的 IPU。

IPU 旨在帮助创新者在 AI 应用上实现新的突破,帮助用户应对当前在 CPU、GPU 上表现不太好的任务或者阻碍大家创新的场景。”卢涛副总指出。

目前 GPU 在全球已是大规模的商用部署,其次是 Google 的 TPU 通过内部应用及 TensorFlow 的生态占第二大规模,IPU 处于第三,是量产的、部署的平台。

与此同时,Graphcore 也在中国积极组建其创新社区。Graphcore 已在微信、知乎、微博和 GitHub 开通了官方频道,旨在与开发者、创新者、研究者更好地交流和互动。

关于未来的 AI 计算领域,未来会是 “CPU、GPU、IPU 并行” 的时代,GPU 或部分 CPU 专注于业务场景的实现和落地,而 IPU 专为 AI 创新者带来更多突破。

 

构建生态链条 IPU 仍在路上

IPU 想要在 AI 计算中拥有挑战 GPU 地位的资格,除了在性能和价格上面证明自己的优势之外,还需要在为机器学习框架提供的软件栈上提供更多选择,获得主流 AI 算法厂商的支持。

在标准生态、操作系统上也需要有广泛的支持,对于开发者有更方便的开发工具和社区内容的支持,才能从实际应用中壮大 IPU 的开发生态。

一个 AI 芯片从产出到大规模应用必须要经过一系列的中间环节,包括像上面提到的支持主流算法框架的软件库、工具链、用户生态等等,打通这样一条链条都会面临一个巨大挑战。

目前申请使用 Graphcore IPU 开发者云的主要是商业用户和高校,个人研究者比较少。IPU 开发者云支持当前一些最先进和最复杂的 AI 算法模型的训练和推理。

 

和本世纪初的 GPU 市场一样,在 AI 芯片市场步入弱编程阶段,如今百家争鸣的局面预计也将很快结束,市场在一轮厮杀后会剩下为数不多的参与者做最终对决。

现在要看的是在发展初期的逐一击破阶段,Graphcore 是否真有定义并主控第三类芯片的魄力了。

不过从创新的架构到芯片再到成为革命性的产品,Graphcore 从芯片到落地之间的距离,需要易用的软件和丰富的工具来支持,特别是对软件生态依赖程度比较到的云端芯片市场。

结尾:

IPU 不是 GPU,这个可能是最大的一个挑战,但同时也是最大的一个机会。IPU 并不是 GPU 的替代品或者类似品,所以不能拿 GPU 的逻辑来套用 IPU 的逻辑。

近两年,AI 芯片出现了各种品类的井喷,可以预计未来 IPU 在各类 AI 应用中将具有更大的优势。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
MK70FX512VMJ15 1 Freescale Semiconductor Kinetis K 32-bit MCU, ARM Cortex-M4 core, 512KB Flash, 150MHz, Graphics LCD, MAPBGA 256

ECAD模型

下载ECAD模型
$17.99 查看
ATXMEGA256D3-AUR 1 Microchip Technology Inc IC MCU 8BIT 256KB FLASH 64TQFP
$6.07 查看
STM32H743XIH6TR 1 STMicroelectronics High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals

ECAD模型

下载ECAD模型
暂无数据 查看

相关推荐

电子产业图谱

AI芯天下是智能芯片行业垂直自媒体。采用媒体+行业的模式,坚持从芯出发,用心服务的理念,致力于丰富的网络基础资源建设。官网:http://www.world2078.com/ 公众号:World_2078