赛灵思ACAP芯片Versal一出剑指AI,英伟达有在怕吗

2018-10-24 08:43:29 来源:EEFOCUS
标签:

赛灵思刚刚推出了首款ACAP芯片

新芯片面向人工智能推理市场,预计该市场将比英伟达目前主导的人工智能训练市场更大;

有朝一日,赛灵思会像英伟达一样成为数据中心市场的主要选手吗?


9月,Evercore ISI发布了半导体股票的“Magnificent 7”名单。上榜的有英伟达和美光等常客,还有一家令人意想不到的公司-赛灵思。众所周知,赛灵思是现场可编程门阵列(FPGA)市场的领导者,具有突出的技术领先优势和市场份额。FPGA是一种可配置的集成电路,尽管有些困难,但可以使用软件对其进行功能配置。Evercore表示,之所以把赛灵思放到推荐股名单中,是看中了它在数据中心市场的长期优势。Evercore的先见之明得到了赛灵思的背书,一个月后,赛灵思推出了一款极具创新性的产品 - Everest(珠穆朗玛峰)。

赛灵思在其核心市场-无线基础设施、视频、音频和广播设备-取得了令人瞩目的成功。此外,其新任首席执行官Victor Peng也经常提醒世人,赛灵思现在把数据中心市场视为公司业务增长最大的领域,是公司未来面向的首要阵地。10月份,赛灵思推出了其新近推出的自适应计算加速平台(ACAP)的第一个产品系列Everest,以及一系列产品代号为Versal(‘ver’代表“多功能”,‘sal’代表“通用”)的第一批ACAP芯片。

Versal
Versal基于台积电7nm工艺打造,结合了软件可编程性和针对特定领域的硬件加速以及当今快速创新所必须的高度适应性。Velsal包括六款器件,采用独特架构,具备高度可扩展性,实现了可满足包括云、网络、边缘计算、无线通信和终端节点等各种应用市场需求的AI推理性能。你可以把Versal视为SoC界的瑞士军刀,它继承了CPU、GPU和可用于数据中心加速的FPGA。

 


在某些方面,Versal类似于赛灵思自家的Zynq Ultrascale + MPSoC,但它具有某些重要的额外功能,可以大大简化开发和部署,因为在Versal上,既可以由软件控制系统,还可以在已知配置上运行。Versal缩减了中央FPGA模块的尺寸,为额外的DSP、ARM内核、推理组件和I/O模块腾出了足够的空间。

时值英特尔和AMD联手在其x86器件上集成GPU和英伟达在其芯片上增加用于深度学习的额外内核之际,该产品的推出时机也堪称完美。

根据Tirias Research的分析师Kevin Krewell的说法,Versal是赛灵思‘努力入局,与英特尔和英伟达同场竞技的举动。’

在AI市场挑战英伟达
今年5月份,赛灵思CEO Peng向Data Center Dynamics透露,Everest是赛灵思历时4年,动用了1500名工程师,投入超过10亿美元研发而成的。显然,对于一家典型研发费用为一年6亿美金的公司而言,10亿美金绝对是一笔庞大预算。在采访中,他对赛灵思迟迟无法撕掉“FPGA公司”的标签感到沮丧,对于业界仅仅将Versal视为FPGA的一次升级更是无法释怀。

“我们一遍又一遍地向业界传达‘不要把Versal当成一款FPGA’的信息,因为作为一家传统的FPGA公司,我们现在不得不说,‘不,我们不再是单纯的FPGA公司了。’现在有了ACAP,尽管现在还没有人知道ACAP到底是什么,但是他们终究会明白的。”

事实上,Peng说他希望赛灵思被视为一家“以数据中心为优先”的公司。赛灵思看到了人工智能和机器学习产生大量需要收集和分析的数据的新趋势,同时5G网络将对其专有的自适应计算加速硬件产生巨大需求。有趣的是,赛灵思声称Versal芯片的能效可以达到英伟达的GPU的四倍,推理性能可以达到英伟达的2-8倍,在处理推理性工作负荷方面比英特尔的Xeon CPU快43-72倍。

赛灵思这种判断相当大胆。不过并非没有先例。现在,英伟达有大约6亿美金或者说20%左右的营收来自于其针对AI优化的数据中心硬件,而这一数字在几年前几乎为零。赛灵思对数据中心市场寄予厚望,是为了复制英伟达的GPU在数据中心领域的成功,但是Peng也承认,预测新业务发展的轨迹很难。

“我很难预测它会怎样发展,”Peng说。“这是一个全新的领域,没有路线图,对所有人都是全新的。我的意思是说,谁能预料到英伟达今日的成功呢?英伟达自己也没有预料到吧!”

 



深度学习:训练和推理
深度学习一度因为需要极高的计算强度而被AI社区抛弃并扫进技术的垃圾堆,但它现在成为了许多AI应用的核心。深度学习可以将复杂任务进行分解,从而使得机器学习成为可能。今天,在某些情况下,一些通过深度学习算法进行图像识别训练的机器甚至可以比人类表现得更好。谷歌的Alpha Go通过深度学习,反复训练并调整其神经网络,最终在2017年击败了全球最棒的围棋选手柯洁。

深度学习可以分为两个过程:训练和推理。神经网络的训练是指将数据输入到系统中,各个神经元都会为其输入分配相应的权重。训练是一种计算密集型任务,因为训练算法本身不会告诉神经网络什么才是正确的答案,而是允许它反复“猜测”,直到它几乎每次都能够选择正确的答案,比如,这张图片到底是不是猫。

 


在数字世界里,训练好的神经网络利用所学到的东西开始工作,以一种简化的应用识别说话、图像、各种疾病,或者建议一个客户接下来可能购买的东西等。完全加权的神经网络通常是一个笨重而庞大的数据库。推理过程则简化所有数据,对它进行压缩和优化,以在运行时加速性能。谷歌的语音识别、图像搜索、恶意软件检测、垃圾邮件过滤和Netflix推荐引擎等任务都使用了某种形式的推理。

GPU拥有并行计算能力(能够同时处理多个任务),已经被用于AI训练和推理。但是,推理任务的性能目标和训练任务有所不同,推理批量输入的数据量较少,以便最大限度减小网络的端到端响应时间。比如,基于云的图像处理任务需要具备高度响应性,以便系统不会堆积了大批图像而造成用户等待上好几分钟。因此,高吞吐量对训练任务更为重要,而低延迟对推理任务更为关键。Versal等可编程硬件完全符合低延迟、低功耗、高频的AI推理工作负荷。

AI开发人员可以利用Versal的异构硬件和以软件为中心的方案。赛灵思这种先行者的发展空间可能很大,赛灵思和巴克莱分享了对AI市场的预测,它认为AI推理可能比AI训练的市场更大,目前的AI训练市场大部分都被英伟达的GPU把持着,边缘节点和数据中心的推理应用则是赛灵思为Versal设定的目标。赛灵思预计,该部分市场的规模将从目前的几乎为零增长到2023年的接近230亿美金。

赛灵思-新的英伟达?
过去两年中,赛灵思积极拓展产品的边界,除了FPGA,其产品组合加入了几个SoC的身影,现在又多了个ACAP。随着人工智能、5G和物联网开始起飞,赛灵思的ACAP将找到广阔的应用空间。也许几年后,投资者会回首当下这个关键时刻,正是从赛灵思发布ACAP起,它开始从一家纯粹的FPGA公司蜕变为像英伟达这样的数据中心市场主要厂商。

赛灵思已经扔下战书,可以期待下英伟达如何接受挑战。不过,如果巴克莱/赛灵思对人工智能推理市场估计有误,那赌注就太高了。有传言称,博通在收购高通失败后,可能会将并购重心转向赛灵思。英伟达过去一直收购图形和游戏行业的公司,或许它可以学一学英特尔,试着买下赛灵思?

 

更多有关赛灵思的资讯,欢迎访问 与非网赛灵思专区

 

与非网编译内容,未经许可,不得转载!


 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
与非网 小编
与非网 小编

电子行业垂直媒体--与非网小编一枚,愿从海量行业资讯中淘得几粒金沙,与你分享!

继续阅读
5个层级带你看清一颗芯片的内部结构
5个层级带你看清一颗芯片的内部结构

在我们阐明半导体芯片之前,我们先应该了解两点。其一半导体是什么,其二芯片是什么。 半导体 半导体( semiconductor),指常温下导电性能介于绝缘体(insulator)与导体(conductor)之间的材料。人们通常把导电性差的材料,如煤、人工晶体、琥珀、陶瓷等称为绝缘体。而把导电性比较好的金属如金、银、铜

又到财报季,相较于台积电、德州仪器的不如预期,英特尔、赛灵思成去年第四季度最大赢家?
又到财报季,相较于台积电、德州仪器的不如预期,英特尔、赛灵思成去年第四季度最大赢家?

刚刚进入2019年,在2018年第四季度一直跌跌不休的半导体公司股票就开始企稳回升了,半导体ETF VanEck Vectors指数在2019年1月份的前十天里上涨了4%。不过,由于分析师们下调了内存芯片公司美光和西部数据的股价,SMH在1月14日下跌了1.7%。

虚拟货币热潮衰退,流出的二手显卡是否适合购买?

随着虚拟货币的热潮衰退,虚拟货币贬值,在挖矿赚不了钱的状况下,矿工也只好将使用过的显示卡卖掉,造成市面开始流通大量的二手显示卡,但这些用于开采的二手显示卡真的适合消费者购买吗?

类似“幽灵”这样的CPU漏洞,让基于RISC-V架构的安全处理器有了生存空间?
类似“幽灵”这样的CPU漏洞,让基于RISC-V架构的安全处理器有了生存空间?

去年有一个新的名为“幽灵”的严重安全漏洞被曝光在大众的视野之下,它也促使每一个从业者开始停下来思考继续前行的方向。像大多数人一样,你基本上也会购买一台搭载CISC指令集通用处理器的计算机,用它打游戏或者进行财务管理。在过去几十年中,处理器供应商一直蒙眼狂奔,大大提高了计算机中使用的通用处理器的性能,这其中包括大名鼎鼎的英特尔、AMD和AR

高通拒绝出售调制解调器给苹果后,不得已转向英特尔的LTE芯片

近日,据外媒报道,苹果表示,它希望在iPhone XS、XS Max和XR中使用高通调制解调器,但在苹果起诉高通的后,高通拒绝出售这些调制解调器。

更多资讯
使用个人数字助理、FPGA技术实现高质量流视频的方案

无线多媒体依赖于复杂的视频软件/服务器技术,而流视频和音频的生成又依赖复杂的处理技术。

基于FPGA的椭圆曲线加密设计

椭圆曲线加密是一种目前已知的所有公钥密码体制中能够提供最高比特强度的一种公钥体制。在FPGA实现椭圆曲线加密系统时,基于GF(2)的多项式有限域中的乘法、求逆运算是其中的两大难点。本文提供了一种椭圆曲线加密的FPGA实现的结构,着重讨论了基于GF(2)的多项式有限域中的乘法、求逆运算的实现,并与软件实现的性能进行了比较。

宇宙最快FPGA产品8年前就已出现?这事得从帕克太阳探测器说起
宇宙最快FPGA产品8年前就已出现?这事得从帕克太阳探测器说起

8年前,NASA和约翰霍普金斯大学联合立项,投入15亿美元打造一款绕日探测卫星。2018年,这款名为“帕克号”的太阳探测器发射升空。帕克号上的电子系统和仪器组由多个FPGA共同控制,帮助帕克号成为有史以来最接近太阳和速度最快的人造航天器。

使用Vivado HLS优化RTL代码以达到最佳性能

用软件从 C 转化来的 RTL 代码其实并不好理解。今天我们就来谈谈,如何在不改变 RTL 代码的情况下,提升设计性能。

用带SRAM的FPGA实现动态可重构技术

由于数字逻辑系统功能复杂化的需求,单片系统的芯片正朝着超大规模、高密度的方向发展。对于一个大规模的数字系统而言,系统规模是基于各种逻辑功能模块的组合。但是,无论是时序逻辑系统,还是组合逻辑系统,或者组合/时序混合系统,从时间轴上来看,系统中的各个功能模块并不是时刻都在工作,而是根据系统外部的整体要求,轮流或循环地被激活或工作。

电路方案