作为 AI芯片两大领域的交差点,AI 芯片已经成了最热门的投资领域,各种 AI 芯片如雨后春笋冒出来,但是 AI 芯片领域生存环境恶劣,能活下来的企业将是凤毛麟角,以下正文:

 

不久前,谷歌在 I/O 大会发布了其第三代 TPU,并宣称其性能比去年的 TUP 2.0 提升 8 倍之多,达到每秒 1000 万亿次浮点计算,同时谷歌展示了其一系列基于 TPU 的 AI 应用。

 

可以说,AI 已经成为科技行业除了区块链之外最热门的话题。AI 芯片作为 AI 时代的基础设施,也成为目前行业最热门的领域。

 

可以看到,AI 芯片已经成为资本追逐的最热门领域,资本对半导体芯片的热情被 AI 技术彻底点燃。在创业公司未真正打开市场的情况下,AI 芯片初创企业已经诞生了不少的独角兽,多笔融资已经超过亿元。

 

AI 技术的革新,其从计算构架到应用,都和传统处理器与算法有巨大的差异,这给创业者和资本市场无限的遐想空间,这也是为什么资本和人才对其趋之若鹜的原因。

 

但是,产业发展还是要遵循一定的产业规律,笔者认为,绝大多数 AI 芯片公司都将成为历史的炮灰,最后,在云端和终端只剩下为数极少的几个玩家。

 

为何这么说,请听本君慢慢道来!

 

首先我们来分析下目前对 AI 芯片的需求主要集中在哪些方面。

 

先来讲讲 AI 目前芯片大致的分类:从应用场景角度看,AI 芯片主要有两个方向,一个是在数据中心部署的云端,一个是在消费者终端部署的终端。从功能角度看,AI 芯片主要做两个事情,一是 Training(训练),二是 Inference(推理)。

 

目前 AI 芯片的大规模应用主要还是在云端。云端的 AI 芯片同时做两个事情:Training 和 Inference。Training 即用大量标记过的数据来“训练”相应的系统,使之可以适应特定的功能,比如给系统海量的“猫”的图片,并告诉系统这个就是“猫”,之后系统就“知道”什么是猫了;Inference 即用训练好的系统来完成任务,接上面的例子,就是你将一张图给之前训练过的系统,让他得出这张图是不是猫这样的结论。

 

Training 和 Inference 在目前大多数的 AI 系统中,是相对独立的过程,其对计算能力的要求也不尽相同。

 

Training 需要极高的计算性能,需要较高的精度,需要能处理海量的数据,需要有一定的通用性,以便完成各种各样的学习任务。

 

Inference 相对来说对性能的要求并不高,对精度要求也要更低,在特定的场景下,对通用性要求也低,能完成特定任务即可,但因为 Inference 的结果直接提供给终端用户,所以更关注用户体验的方面的优化。

 

Training 将在很长一段时间里集中在云端,Inference 的完成目前也主要集中在云端,但随着越来越多厂商的努力,很多的应用将逐渐转移到终端。

 

然后我们来看看目前的市场情况。

 

1、云端市场已被巨头瓜分殆尽,创业公司生存空间几乎消失。

云端 AI 芯片无论是从硬件还是软件,已经被传统巨头控制,给新公司预留的空间极小。下面这张图是 Compass Intelligence 公布了全球 AI 芯片榜单。因为 AI 芯片目前在终端应用极少,所以榜单头部的排名可以近似的认为就是云端 AI 芯片的目前市场格局。

 

 

我们可以看到,芯片巨头 Nvidia(英伟达)已经牢牢占据 AI 芯片榜首,由于 CUDA 开发平台的普及,英伟达的 GPU 是目前应用最广的通用 AI 硬件计算平台。除了有实力自研芯片的企业(全世界也没几家),如果需要做 AI 相关的工作,必定需要用到 Nvidia 的芯片。Nvidia 的芯片应用普遍,现在所有的 AI 软件库都支持使用 CUDA 加速,包括谷歌的 Tensorflow,Facebook 的 Caffe,亚马逊的 MXNet 等。

 

除了一骑绝尘的英伟达,其他老牌的芯片巨头都没闲着,特别是 Intel 通过买、买、买奋力的将自己挤到了头部玩家的位置。微软在最新的 Build 大会上公布了基于英特尔 FPGA 的 AI 方案,而英特尔的 FPGA 业务正是通过收购 Altera 获得的。

 

除此之外,我们可以看到像 Google 这样的互联网厂商也乱入了前五。这当然要归功于上面提到的 TPU,虽然谷歌不直接售卖芯片,但是谷歌通过云服务提供 TPU 的调用服务。谷歌很早就开源了 Tensorflow 软件平台,这使得 Tensorflow 成为最主流的机器学习软件平台,已经成了事实上行业的软件平台标准。而 Tensorflow 最佳的计算环境必定就是谷歌自己的云服务了,通过软件、硬件(或者说云)环境的打通,谷歌妥妥的成为 AI 芯片领域的一方霸主。

 

现在业界争论的焦点是 AI 芯片的处理器架构用哪种是最好的,有前面提及的有 GPU、FPGA、DSP 和 ASIC,甚至还有更前沿的脑神经形态芯片。现在 GPU 可以认为是处于优势地位,但其他几种的处理器架构也各有优势。Intel 则是多方下注,不错过任何一种处理器架构。谷歌在 TPU(其实就是一种 ASIC)方面的巨大投入带来了硬件效能的极大提高,目前看来对 GPU 的冲击将是最大的,原因不单单是因为专用架构带来的效率优势,还有商业模式方面带来的成本优势。在半导体行业内的普遍观点是,一旦 AI 的算法相对稳定,ASIC 肯定是最主流的芯片形态。看看挖矿芯片的进化历程,这个观点非常有说服力。

 

在云端,互联网巨头已经成为了事实上的生态主导者,因为云计算本来就是巨头的战场,现在所有开源 AI 框架也都是这些巨头发布的。在这样一个生态已经固化的环境中,留给创业公司的空间实际已经消失。所以地平线的余凯在前几年就对「商业技术评论」表示,云端市场是巨头的禁脔,创业公司没有任何机会。

 

2、终端市场群雄割据,机会尚存。

上面说到了 Inference 现在主要是在云端完成的,这主要是因为现在终端上基本没有合适的处理单元可以完成相应功能。所以我们发现很多 AI 功能都需要联网才可以使用,这大大限制了 AI 的使用场景。所以将 Inference 放到终端来,让一些功能可以本地完成,成了很多芯片厂商关注的领域。

 

华为的麒麟 970 便是最早将 AI 处理单元引入到终端产品的芯片,其中该芯片中的 AI 核心,是由 AI 芯片创业公司寒武纪提供的 IP(知识产权)。该芯片的引入,可以帮助华为手机在终端完成一些特定的 AI 应用,比如高效的人脸检测,相片的色彩美化等。此后,苹果,三星都宣布了在其处理器中引入相应的 AI 处理单元,提升手机终端的 AI 应用能力。

 

在终端上,由于目前还没有一统天下的事实标准,芯片厂商可以说是八仙过海各显神通。

 

给手机处理器开发 AI 协处理器是目前看来比较靠谱的方式,寒武纪 Cambricon-1A 集成进入麒麟 970 就是一个很好的例子。由于华为手机的巨大销量,寒武纪迅速成为 AI 芯片独角兽。而另外一家创业公司深鉴科技此前获得了三星的投资,其 AI 芯片 IP 已经集成到三星最新的处理器 Exynos 9810 中。

 

然而能获得手机大厂青睐的 AI 芯片厂商毕竟是少数,更多的 AI 芯片厂商还需要找到更多的应用场景来使自己的芯片发光发热。

 

一些传统 AI 服务厂商很容易想到将自己的服务进行垂直拓展,比如的自然语音处理厂商云知声从自己的传统语音业务出发,开发了自己的芯片 UniOne 语音 AI 芯片,用于物联网 IOT 设备。

 

相对于语音市场,安防更是一个 AI 芯片扎堆的大产业,如果可以将自己的芯片置入摄像头,是一个不错的场景,也是很好的生意。包括云天励飞、海康威视、旷视科技等厂商都在大力开发安防领域的 AI 嵌入式芯片,而且已经完成了一定的商业化部署。

 

相对于云端,终端留给 AI 芯片创业公司更广阔的市场。但是于此同时,由于应用环境千差万别,没有相应的行业标准,各个厂商各自为战,无法形成一个统一的规模化市场,对于投入巨大的芯片行业来说,是好故事,但不一定是个好生意。

 

3、怎样的 AI 芯片企业会有机会?

AI 芯片的诞生,源于一种全新的计算需求,传统的计算架构很难满足 AI 计算的要求,所以新的芯片成为业界追逐的热点,这和多年前的显卡市场非常像。

 

曾经的 PC 并没有 3D 处理能力,CPU 几乎包揽了所有的功能,但是由于人们对于 3D 处理需求的逐渐增加,带有 3D 加速功能的图形处理器越来越成为人们关注的重点。

 

于是一大批图形处理器企业如雨后春笋搬冒了出来。

 

然而最后,只有 Nvidia(也是目前的 AI 芯片巨头)作为独立的 3D 图形处理器供应商活了下来。ATI 被 AMD 收购,仍然耕耘 3D 图形市场,和 Nvidia 正面作战,但常年的亏损也一直困扰着这个千年老二。Intel 早早退场,放弃了独立显卡产品线,但由于其控制了中央处理器,其显示核心一直以集成的方式变相的和 Nvidia 以及 AMD 曲线作战。

 

Nvidia 之所以获得成功,有以下几方面原因。

 

首先在性能上,始终保持在第一梯队,在最开始几代失败的产品后,Nvidia 一直是最先进图形技术的代名词。当然,光有性能是不够的,当时世面上还有很多性能差不多的产品。Nvidia 在当时做了一件现在看来很平常的事情,就是推出了专属驱动程序——雷管,并定期的更新,使其不断的兼容最新的游戏。这在当时显卡标准混乱,游戏兼容一塌糊涂的情况下,一举奠定了其领先位置。

 

于此同时,Nvidia 拥抱了当时最大软件平台微软推出的 3D 图形 API 接口——Driect 3D,在此之前,每家显卡都有自己的 3D API 接口,标准极度不统一,也让开发者非常头痛,Driect 3D 出现结束了这个局面,所以谁对 DirectX 支持好,谁就更受市场欢迎。Nvidia 和 ATI 一直和微软合力推动 DriectX 和显卡的换代升级,也因此坐稳了了 PC 显卡的领先位置。

 

芯片是一个赢者通吃的市场,由于高昂的研发费用,只有市场第一才能形成规模优势从而转化成成本优势,最后将其他玩家赶净杀绝,无论是传统的 GPU 行业还是 CPU 行业,都存在相同的情况。

 

然后我们再过来看 AI 芯片市场,AI 云端市场,其实更接近于显卡市场的末期,主导的软硬件生态已经形成,巨头控制整个软硬件和服务市场。如果 AI 技术在理论层面没有新的突破,依然是以深度学习为基础进行迭代升级的话,这个局面并不容易打破。

 

在终端市场,更接近于显卡市场发展的初期,没有统一的 API 接口,没有统一的基准测试,没有成熟的应用场景。所以终端市场对于 AI 芯片创业公司来说,还是值得一搏的,但这也是一场硬仗,你必须在核心性能上拥有优势,或是处理速度,或是功耗控制,总得有拿的出手的杀手锏。第二,必须赌对标准,站到胜利者一边,并借此快速占领市场。谁都想成为标准的制定者,但很多时候,你必须拥护其他人的标准,甚至是竞争对手的标准,才能赢得市场。

 

4、老三必死

芯片产业是一个资金密集型的产业,无论是研发,还是后期的生产,都要求极高的资金投入。如果产品没有办法规模化,将无法消化前期的高额开销,将企业拖入亏损的泥潭。

 

拿 PC 行业 CPU 和显卡领域的千年老二 AMD 为例,虽然常年坐二望一,偶尔爆发短期超越,但其财报可谓惨不忍睹,亏多盈少,经常以亏损减少为荣,基本不提盈利。但也因为芯片行业能保持市场第二,已经属于不易,所以 AMD 即使常年亏损,其战略地位仍然极具价值,仍然是芯片行业重要玩家。至于老三,好像是不存在的(就是台湾的威盛,已经毫无市场存在感)。

 

移动芯片领域也存在类似的情况,高通和联发科几乎垄断了整个市场,除了苹果、华为、三星、依托自己的终端优势,撑起了自己的芯片业务,其他纯粹的芯片玩家已经基本被清场,又是一个和图形处理器市场发展非常相似的过程,从百家争鸣到寡头垄断。

 

而在 AI 芯片领域,这种情况也将继续。头部玩家将吃下几乎所有市场,而第三名以外的玩家,即使能活下来,也只有喝汤的份了。

 

5、天下属于王者,但最精彩故事永远是在乱世。

秦始皇统一中原,奠定了中国大一统帝国的统治基础,但让人神往的却是之前的诸子百家。在那个思想激昂的年代,各种思潮不断涌现,为后人提供了无限的精神财富。

 

在微软统治 PC 操作系统之前,还有很多伟大的操作系统,比如 OS/2、VMS,BeOS、Netware 等。虽然这些系统在商业上失败了,却给整个行业留下了宝贵的财富,系统不只有一种实现方法,还有更多的可能。

 

AI 芯片创业者们,正在用他们认为可行的方式,探索着行业的各种可能,虽然我们知道在最后,绝大多数的尝试都将失败,但这些失败将成为推动整个产业发展的动力,将技术快速转化成真正的应用,推动社会的发展。

 

若干年以后,当人们回顾 AI 行业的发展,可能会发现,最精彩的故事就发生在这个群雄并起的时代。