加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

芯片世界观 | 谷歌TPU抢夺AI高地没戏?英伟达Volta凭啥成最热AI网红

2017/05/12
21
阅读需 11 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

去年,英伟达 GPU 技术大会上,首席执行官黄仁勋在演讲中公布了新的 Pascal GPU 架构,第一款产品便是 Tesla P100。虽然没有提及消费级显卡,但是表示基于 Pascal 的 GTX 1080 将在几个月后发布。

在今年的 GPU 大会上,英伟达发布了最新的 GPU 架构 Volta。Volta 架构的第一款产品是 Tesla V100,将用于数据中心。Tesla V100 有两种,一种是通过英伟达专有的 NVLink 与服务器(或者其他 V100)互连的夹层卡(如下图所示);另一种是双宽 PCIE 卡。
 

V100 相比 P100,要大一些、更强悍、更具震慑力。芯片面积为 815mm,采用台积电先进的 12nm FinFET 工艺,拥有 210 亿个晶体管

对这个一时间走红的 V100,我们如何理性看待?

对于台积电 12nm FinFET 工艺,只是 16nm FF 工艺的一个稍稍改进版。这在晶体管面密度方面,Volta 与 Pascal 近乎相同。工艺的改进,带来的优势主要在功率方面。不过,V100 的确是一个令人印象深刻的芯片。

Volta 独特之处在于包含了 640 个新增的张量核(Tensor Core)。Tensor Core 执行专门的矩阵运算。谷歌 TPU 以及 ASIC 对通用 AI 芯片造成威胁。英伟达的战略就是,将 TPU 融入自己的产品中,粗暴地将 TPU 作为一个专门的子处理器融合入其 GPU 中。Tensor Core 的速度非常快,相比 Pascal,速度提升了 5 倍。

Tensor Core 有助于提升推理处理的性能。英伟达声称 V100 在推理处理方面大约是 P100 的 3 倍,但是英伟达并没有与谷歌 TPU 进行对比。很明显,英伟达尽全力表现自己就是为了否定 TPU 以及 ASIC 的独特优势。

去年,英伟达推出 DGX-1 这个超级计算机,今年 DGX-1 已经升级为 DGX-1V,配备 Volta V100 和新的 NVLink 2.0(带宽为旧接口的两倍)。

02

在黄仁勋 GTC 2017 主题演讲中,也可以了解到下一代 PX 平台 Xavier 的细节。Xavier 性能表现的关键在于内置了 Volta GPU,而 Tensor Core 的存在使 Xavier 的高效能性得以实现。


自动去年 10 月英伟达 Drive PX 2 被特斯拉采用,英伟达逐渐建立起其在自动驾驶领域的地位,并获得了高速的发展与增长。

今年,英伟达似乎会加快 Xavier 在自动驾驶领域的部属。英伟达还宣布和丰田合作,丰田将采用英伟达 DRIVE PX 车载 AI 计算平台,并希望在 2020 年左右将自动驾驶车推向市场。

我相信英伟达在自驾车的处理器方面遥遥领先,汽车行业将或多或少将英伟达的处理平台作为标准。即便英特尔将 Mobileye 收入囊中,但似乎已经太晚了。

说了这么多,我对于英伟达的关注已经很久,我相信消费级基于 Volta 的产品也不会太遥远。

更多有关英伟达的资讯,欢迎访问 与非网英伟达专区

与非网编译内容,未经许可,不得转载!

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
PIC24FJ256GB108T-I/PT 1 Microchip Technology Inc 16-BIT, FLASH, 32 MHz, MICROCONTROLLER, PQFP80, 12 X 12 MM, 1 MM HEIGHT, 2 MM, LEAD FREE, PLASTIC, TQFP-80
$7.54 查看
ATXMEGA32A4U-AUR 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQFP44, 10 X 10 MM, 1 MM HEIGHT, 0.80 MM PITCH, GREEN, PLASTIC, MS-026ACB, LQFP-44

ECAD模型

下载ECAD模型
$13.97 查看
STM32H743XIH6 1 STMicroelectronics High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals

ECAD模型

下载ECAD模型
$31.15 查看
英伟达

英伟达

为这个时代的达芬奇和爱因斯坦们提供超强计算性能。我们开创性地开发出一种超强计算形式,深受全世界对计算机有超高要求的用户的青睐,包括科学家、设计师、艺术家和游戏玩家。对于他们而言,我们的创造几乎可媲美时间机器。基于对更优质 3D 图形永无止境的需求以及当下庞大的游戏市场,NVIDIA 已在这个虚拟现实、高性能计算和人工智能的交叉口,将 GPU 发展为计算机大脑。

为这个时代的达芬奇和爱因斯坦们提供超强计算性能。我们开创性地开发出一种超强计算形式,深受全世界对计算机有超高要求的用户的青睐,包括科学家、设计师、艺术家和游戏玩家。对于他们而言,我们的创造几乎可媲美时间机器。基于对更优质 3D 图形永无止境的需求以及当下庞大的游戏市场,NVIDIA 已在这个虚拟现实、高性能计算和人工智能的交叉口,将 GPU 发展为计算机大脑。收起

查看更多

相关推荐

电子产业图谱